数字人

数字时代的宠儿 虚拟代言人亮相1024开发者节

十八般武艺并发,二十四小时不休。科大讯飞全球1024开发者节AI虚拟代言人“一聆”闪亮登场!

十八般武艺并发,二十四小时不休。科大讯飞全球1024开发者节AI虚拟代言人“一聆”闪亮登场!

科大讯飞全球1024开发者节首位AI虚拟代言人 一聆

元宇宙的热潮下,虚拟数字人被认为是与元宇宙交互的重要途径,是真人在元宇宙中的身份存在。一聆就是一位来自1024Meta的Z世代少女,她善解人意,拥有天籁般的声音,在灵动甜美的外表下,有着对AI的坚守及建设美好世界的祈盼。

迎来首位AI虚拟代言人的2022科大讯飞全球1024开发者节,将现场展示如何通过AI构建虚拟数字人,助推虚拟人技术在千行百业的应用。

小小的身体 大大的智慧

想要深入了解一聆,就要从她的诞生说起,主要分为三个阶段,建模、驱动和交互。建模搭起了一聆的骨架模型,驱动让一聆像人类一样动起来,交互则让一聆的外观更加自然生动。

看似简单的制作步骤,其中却蕴含着AI的大智慧。一聆来自于科大讯飞AI虚拟人交互平台,运用讯飞最新的虚拟形象构建技术,结合了语音合成、语音识别、知识图谱、图像处理、机器翻译、形象驱动等多项AI核心技术。

美貌与智慧并存的一聆,在AI的加持下,不仅拥有人的外观、行为、表情,还具有识别外界环境、与人交流的能力。在1024开发者节现场,观众将有机会体验与虚拟数字人的互动。

如何高效构成虚拟数字人

当前虚拟数字人制作可分为两大类,一类是人工设计建模,另一类是AI生成。前者的制作过程从原画设计、模型建模、骨骼表情绑定、动作设计到驱动能力,需要几周甚至数月的时间,整个过程工作量大、技术门槛高。而AI生成的虚拟数字人,则可以通过算法、AI学习等技术,让低成本高效率的虚拟人应用成为现实。

讯飞推出的个性化2D/3D虚拟人构建系统在很少的输入条件下,例如1张照片,即可秒级生成和驱动2D和3D虚拟人。此外,个性化精细调整的功能,也能支撑对定制需求更高的泛娱乐场景下的应用,挖掘更多可能。

个性化3D虚拟人构建系统

多场景应用,让虚拟人成为数字生产力

生于元宇宙的一聆,是科大讯飞虚拟数字人家族的一员。自2019年全球首个多语种虚拟主播小晴发布至今,讯飞面向全行业音视频内容生产,打造了众多虚拟人形象。除了一聆,还有多次亮相WAIC的虚拟主播小颜、演唱主题曲《为冬奥破冰》的爱加、入学上海音乐学院的AI虚拟歌手LUYA等等。

具有多模感知、多维表达、情感贯穿、自主定制四大核心特点的讯飞AI虚拟人交互平台,于2021年10月正式发布。联合产业合作伙伴,科大讯飞建立了更加丰富的虚拟人数字资产库,覆盖虚拟主播、虚拟客服、虚拟数字助手等众多虚拟形象与声音,提供媒体、金融、政企、文旅、教育、文娱等多场景解决方案,让虚拟人成为人类的伙伴。

科大讯飞虚拟数字人

在文旅行业,科大讯飞虚拟数字人就有着深入的应用。旅游圈中一直流传着一句话,得IP者得天下。传统文旅行业,依靠文字、宣传册、导游等进行景区导览,主要面向大众,难以满足个性化需求。近几年随着线上直播、云旅游、沉浸式旅游等新模式的涌现,虚拟数字人的应用层出不穷。在凤阳县沉睡了600多年的明中都遗址公园中,就来了一位由科大讯飞打造的虚拟数字导游小可。

“明中都有多大?明中都有什么价值?明中都的布局是什么样?……”针对游客们的提问,小可会以文字、图片、视频等多种形式进行解答,可爱、博学的小可吸引了许多游客的围观。此外,小可还可以提供周边信息、出口位置、酒店住宿、景点导航、路线指引等服务,通过地图、动画等多种方法,结合AR、VR、一体机、移动端等形式向游客展现景区的故事背景、游览的流程和地点,提升游客接待效率,降低服务成本,提高用户体验。

游客与小可交流

类似小可的讯飞虚拟数字人还有很多,面对广阔的虚拟现实产业,科大讯飞将不断提供技术“基石”,包括智能语音、计算机视觉、自然语言处理、机器学习等,来实现眼耳鼻身等多通道感知融合的高沉浸人机交互。

为了打造专业、开放的虚拟人设计生态,加速元宇宙发展,科大讯飞历时4个月,汇聚全国优秀设计师,举办2022科大讯飞虚拟人形象设计大赛,致力于虚拟人内容创作与IP孵化。在11月17日-20日乐享现场的1024开发者节,将会展出其中44份优秀作品,共同感受虚拟人的蓬勃生机。

迫不及待想体验虚拟数字人?

24快报
JSON抓取失败