数字孪生

微美全息开发基于应用场景的虚拟数字人手势生成算法

在虚拟技术、大数据、人工智能等技术的加持下,虚拟数字人不断演化,形象越来越逼真,应用范围越来越广,商业价值越来越大,根据某市场研究机构推出的《虚拟数字人深度产业报告》预测,到2030年我国虚拟数字人整体市场规模将达到2700亿元。

在虚拟技术、大数据、人工智能等技术的加持下,虚拟数字人不断演化,形象越来越逼真,应用范围越来越广,商业价值越来越大,根据某市场研究机构推出的《虚拟数字人深度产业报告》预测,到2030年我国虚拟数字人整体市场规模将达到2700亿元。

虚拟数字人是基于计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等技术打造的、具有外貌特征、表演能力、交互能力等人类特征的复合体,其具有人的几何特性和行为特性。虚拟数字人从制作到外观的数字化,逐渐深入到行为的交互化、思想的智能化,其不仅具有人的外观和行为,还拥有人的思想,能够识别外界环境,并与人进行自然交互。

手势作为重要的交互方式,已被广泛应用在汽车导航、虚拟仿真等领域。虚拟数字人作为新一代的交互平台,能融合其他交互技术提供多模态的交互体验。通过建立抽象的交流意图与手势的物理实现之间的映射,生成丰富的手势,可让虚拟人的情感表现力更加丰富。

据了解,微美全息正在开发基于应用场景的虚拟数字人手势生成算法系统,通过环境的变化让虚拟数字人产生不同的动作。并不是虚拟数字人的每句话都要伴有手势,同一句话在不同场景下的手势也会有所不同,因此,对虚拟数字人的应用场景需进行深层次的设计。

将抽象的交流意图通过自然语言处理,再将文本映射到手势语义的分类中,构建语义分类模型。首先给出判断是否需要手势,因为手势是辅助和增强语义表达的,对于不确定是否需要手势的情况,倾向于给出不需要手势的结果。然后对所构建的不同场景的语料库进行统计,分析库中所有动作的模式及其与语义的对应关系,整理语料库中的有语义的动作,进行情感、手势隐喻语义、原始文本与手势量化描述语言的映射关系,并构建分类模型。从语义到手势量化描述的映射过程是一对多的分类问题。针对不同应用场景,使用不同语料库进行训练。对于同一个隐喻手势语义细分类别下的多个手势,采用自然语言处理技术,对手势文本与输入文本进行语义匹配,选择最匹配的手势。对于交流意图,通过自然语言理解,构建该文本到情感、手势隐喻语义的分类,与原始文本的关联关系,最终生成虚拟数字人手势。

虚拟数字人手势交互极大提升了其情感表现力。WIMI微美全息基于应用场景的虚拟数字人手势自动生成算法,利用隐喻手势的语义分类方法,构建手势的量化描述语言,为手势的语义可计算提供了量化方法,并提出了针对不同应用场景的情感语料库构建方法,并构建富有情感的语料库,为虚拟人手势生成算法研究提供了数据基础。

总的来说,当前虚拟数字人的理论和技术日趋成熟,应用范围也在不断扩大。虚拟数字人已经在金融、交通、物流、零售、制造业等多个行业得到应用,助力不同行业实现数智化转型。

24快报
JSON抓取失败