数字孪生

虚拟数字人厂商内卷元宇宙

一直以来," 虚拟数字人 " 都被视为另一个更大的概念 " 元宇宙 " 的重要组成部分,而受到广泛关注。

作者:刘旷

一直以来," 虚拟数字人 " 都被视为另一个更大的概念 " 元宇宙 " 的重要组成部分,而受到广泛关注。而且,在元宇宙被某些厂商不时拿出来翻炒的时候,虚拟数字人的应用其实是走在前列的,发展至今虚拟数字人从设计、制作到落地应用的体系逐渐完整。技术的进步和内容的创新催生出了不同的商业模式,使得虚拟数字人产业进入了商业化加速的阶段。

但这种 " 超前 " 并不是无限的,至少在商业化面对的对象层面,虚拟数字人还 " 止步于 "B 端。虚拟数字人在 C 端缺少应用空间和变现方式的现状,使得虚拟数字人厂商的竞争主要在 B 端集中进行。

集中在 B 端的需求

从已有的商业模式出发,虚拟数字人大致能够分为 IP 型和非 IP 型,虚拟数字人厂商基本围绕这两个概念进行生产经营活动。

其中 IP 型按照企业具体需求和变现模式,又能分为 MCN 机构和娱乐公司定制的虚拟 KOL 和虚拟偶像、品牌定制的品牌类虚拟人和真人明星为原型的孪生类虚拟人,其主要依靠粉丝经济创造效益,是短期内变现效率最高的一大类别。

非 IP 型作为功能性场景应用,主要以服务为主,单体产生经济效益不及前者,但它作为虚拟空间的基础要素,潜藏规模极为庞大。而能够比较稳定产出的商业类虚拟数字人,又可以分为基础服务型和身份型两类。其中前者正在持续渗透,未来可能会代替 APP 和 UI 界面的功能;而后者类比微信号、手机号、邮箱等与用户强绑定的主体延伸。

和大多基于互联网的应用,最先在 C 端发展出商业模式不同,虚拟数字人的商业化首先在 B 端开展。这是因为当下需求主要集中在 B 端,而 B 端需求主要集中在 IP 型虚拟数字人领域——这是由 IP 型虚拟数字人作为一种符号的稳定性和高可塑性所决定的。

而非 IP 型虚拟数字人则受限于性能(形象、交互能力等)和成本,还不足以普及开来;以身份型虚拟数字人为主要目标的普通消费者也缺乏应用土壤,虽然目前已经有一些号称落地的 " 元宇宙应用 ",但实际使用起来依旧达不到其应有的标准,目前看来倒是占坑位的意义更大一些。

从规模和商业空间的角度来讲,当然是非 IP 型虚拟数字人更加广阔,但现实是 IP 型虚拟数字人的应用因为需求的短期聚集,和对成本的高度容忍而走在了非 IP 型虚拟数字人之前。

虚拟数字人虽然在表现形式上因为直观而显得简单,但想要实现一个形象的从无到有,其实是比较复杂的。具体来说:中游运营厂商会根据需求进行形象设计,然后递交上游技术厂商,经过涉及建模、渲染、动捕、面捕等技术的制作过程交付成品,再对接下游应用方的企业。

在这个流程中,根据类型的不同,虚拟人的制作成本从几十万到几百万不等,制作周期从 15 天到 3-4 个月不等,例如制作难度较低、周期较短的二次元类型虚拟形象成本就在 10-15 万元区间;而后续的运营成本则由运营物料的制作费用和周期决定,一般超写实虚拟人的视频制作成本在 8000-15000 元 / 秒,也就是说,一个短视频就要花费十几万元。

同时,复杂的制作流程、高昂的制作成本以及无限的后续运营 , 也决定了没有核心技术和商业模式的虚拟数字人厂商的生命周期可能非常短暂。因此,这就意味着面向 B 端的虚拟数字人厂商的关键词在于技术路线和商业模式——并由此延伸出虚拟数字人的两条路径。

让虚拟数字人 " 活 " 起来

从虚拟人创造的收益在产业链中的分配来看,其中大约 60% 都被作为技术方参与的虚拟数字人厂商拿走了。按照技术路线的不同,技术型虚拟数字人厂商(简称 " 技术型厂商 ")的能力有所偏向,因而擅长的虚拟数字人类型也不同,具体来说,能够总结出三种被验证了的商业模式。

第一种是通过建模和渲染等技术,收取虚拟数字人及其相关场景的一次性制作费用。几乎所有的技术型厂商都有所涉及,可以说这是技术型厂商的基础能力。但有一些专精软件方面的技术型厂商,如相芯科技、叠镜数字、虚谷未来等,聚焦在了虚拟数字人的生成环节,拥有以较快速度生成虚拟数字形象的能力。

第二种是通过动作捕捉、面部捕捉和人工智能技术,收取虚拟数字人使用期间的技术授权费用。动捕和面捕玩家,主要脱胎于影视行业,在多年特效制作的磨练下,工业流程较为成熟,行业集中度也比较高。走这种技术路线的技术型厂商,基本上都需要大量硬件设备和相应的影棚环境,相关的企业有青瞳视觉、凌云光等,它们或是出租设备和场地,或是承接动捕和面捕服务。

与此同时,随着识别算法的进步,目前已经能够利用手机摄像头进行基本的动作捕捉,虽然精度的确不高,但极大地降低了虚拟数字人的准入门槛,为一些个人势(未与机构签约)的虚拟偶像提供了便利。

而在人工智能技术方面,许多 AI 厂商如商汤、旷世、科大讯飞等,它们在虚拟数字人赛道表现出来的能力,普遍是对人工智能技术的包装和应用。例如商汤的 SenseMARS Avatar 就能从照片或视频中,生成不同风格的虚拟形象;科大讯飞的虚拟数字人业务则是自身以语音为核心的 AI 技术的延伸,能够实现 " 面对面 " 交互——前者收取使用费用或授权费用;后者则以定制为主。

第三种是通过打造聚合的技术平台、元宇宙平台,收取平台使用费用。这种平台式的商业模式,主要是互联网大厂在做。一方面,相较于技术单一型的厂商,虚拟数字人的技术和应用与互联网的关系最为紧密,无论此时是以 B 端为主,还是以后元宇宙在 C 端全面渗透,都能够通过打造平台来实现各个环节的降本增效。

另一方面,这种平台与互联网厂商自身的业务结合后,更有可能发展成为 " 真正意义上的 " 元宇宙,先天快他人一步。最经典的案例就是百度推出的希壤,它一边面向 B 端,收取平台入驻费用,一边面向 C 端,收取增值服务费用。

总结起来,三种商业模式实际上是依次递进的。首先,建模和渲染在 " 静 " 的层面给予虚拟数字人最初的形象;其次,动捕、面捕以及人工智能技术赋予的交互能力则在 " 动 " 的层面让虚拟数字人能够使人代入、共情;最后,以元宇宙为内涵的平台的出现使虚拟数字人 " 活 " 了起来。

像真人一样去运营虚拟数字人

在虚拟数字人产业链中,与技术型厂商相比,主要以内容产出为主的运营型虚拟数字人厂商(简称 " 运营型厂商 ")的商业模式就显得更加 " 传统 ",因为其中参与者多是 MCN、娱乐公司和营销公司。

对于虚拟数字人来说,技术是其成立的前提,但在元宇宙平台还没有真正实现之前,如何 " 活过来 " 成为虚拟社会的一份子,是运营型厂商的责任。但需要注意的是,目前运营型厂商的商业空间主要集中在 IP 型虚拟数字人范畴内。

运营型厂商将虚拟数字人视作媒介。虚拟数字人的形象、性格、人设都是可操作的,运营型厂商通过调整这些社会意义上的参数,来塑造一个个与众不同的形象,并通过运营中的种种技巧来使它 " 表现得与真人无二 ",能够被受众接纳,进而增加变现的可能性,使商业模式得以闭环。

因此,运营型厂商的核心业务是虚拟数字人 IP 及数字资产运营。以次世文化为例,它是定位于面向 B 端客户,提供虚拟数字人 IP 形象设计、制作到运营的全链条服务的综合型数字人技术服务商,其业务可以根据虚拟数字人 IP 的所有权分为自主运营以及代理运营。

关于自主运营,次世文化推出了国风超写实虚拟 KOL" 翎 Ling"。她在设定上是 " 一个热爱国风文化的跨次元女孩儿 ",因此其静态表现如微博、动态表现如抖音中显示出来的形象,或多或少都包含着国风元素。

从运营角度来讲,这极大地凸显了虚拟数字人的稳定性和受制于成本和制作周期的极高运营难度。一方面,真人很难像这样严地苛时刻保持稳定的人设;但另一方面,虚拟数字人运营所需的高昂制作成本、超长制作周期,使得 " 翎 Ling" 只能在微博上保持 4-5 更 / 月的速度,抖音最近更是只在有商单合作时才进行更新,这一点就比不上真人 KOL 的生产力了。

关于代理运营,次世文化在明星的孪生虚拟人方面,与迪丽热巴联合推出了 " 迪丽冷巴 ",与黄子韬联合推出了 " 韬斯曼 ",将明星的孪生虚拟人放进游戏和漫画多种媒介中,并基于此开发了明星的孪生虚拟人的实体衍生品。在商业模式上,明星孪生虚拟人的 B 端 C 端界限分明,次世文化能够直接从收益中按比例分成。

在品牌数字资产定制方面,次世文化能够基于品牌调性,设计不同风格形象、不同人设特点的虚拟数字人。例如次世文化通过全流程合作方式,为 I Do、花西子等十个品牌打造数字资产,显示出非常强的量产 IP 能力。

但从次世文化的表现中,可以发现问题有二:一是运营型厂商在变现方式上缺乏足够的想象力,因为其运营模式与真人网红没有本质差别,所以其商业模式还是品牌代言、直播带货和 IP 衍生这 " 老三样 ";二是运营型厂商不擅技术,其虚拟数字人制作需要外部技术支持,例如 " 翎 Ling" 就是次世文化与技术型厂商魔珐科技共同打造的——它没有能力独自完成。

归根结底,运营型厂商在产业链中的定位类似于 " 中介 "。它们之所以能提供 " 全产业链的服务 ",是因为一方面连接着上游的技术型厂商,随时能够获得技术支持,另一方面连接着下游的应用企业,随时能够获得相关需求,并基于自身对娱乐内容的理解把握两端平衡。

全栈化成大趋势

从元宇宙的角度来看,各种生活方式和场景,都能在元宇宙中镜像式地生成出来。这就意味着,一方面每个用户都需要独属于自己的虚拟数字人;另一方面也需要数量更加庞大的非 IP 型虚拟数字人提供各种基础服务。也正是因此,元宇宙中潜在的需求正在要求现实中的厂商能够快速批量地生产非 IP 型虚拟数字人。

虚拟数字人的外观可以依靠建模、渲染进行合成,但是其表现出来的行为和感染力,就需要人工智能技术来实现。就目前情况而言,AI 技术决定了虚拟数字人的 " 仿真能力 "。例如自然语言处理技术(NLP)决定了虚拟数字人是否能够识别和理解语义;而语音合成技术(TTS)则决定了虚拟数字人在回复时,其语音是否符合真人习惯的声调、情感和习惯。

无论是技术型厂商,还是运营型厂商,面对这种要求,都显示出一种融合的总体趋势,都在向着一体化解决方案提供商缓慢演变。例如以 AI 为核心能力的技术型厂商会为垂直领域提供解决方案;以动捕、面捕为核心的厂商会搭售软件;运营型厂商则弥漫产业链的上下游,一边增强技术能力,一边直接通过运营虚拟数字人直接获利。

除此之外,其中最核心的就是虚拟人垂直赛道的独立软件开发商(ISV),例如中科深智、拟仁智能以及前面提到过的魔珐科技。和技术型厂商、运营型厂商提供的定制化一站式虚拟数字人解决方案服务不同,ISV 的注意力集中在将虚拟数字人的制作能力封装成可快速部署的轻量化标准化 SaaS 产品。

总的来说,ISV 们更注重生产的效率。一方面是生产虚拟数字人的效率,B 端客户通过平台提供的预设模板,自行设定各项参数,快速形成 " 半个性化 " 的虚拟数字人形象,或者也可以根据已有设定快速形成虚拟形象;另一方面是生产数字内容的效率,通过平台提供的语音动画合成技术(Voice to Animation),将文本自动转化为语音,结合虚拟数字人形象自动生成视频,并且用户还能对视频进行后期调整。

以魔珐科技为例,其旗下 " 三维虚拟内容制作智能云平台 " 满足了 B 端客户从获客、到生产、再到管理的虚拟内容制作流水线;" 虚拟直播和线下实时互动产品 " 满足的是虚拟数字人直播场景的需求,从生成实时动画到直播系统搭建,均能够一站式完成;"AI 虚拟人能力平台 " 主要通过文本驱动语音及动画技术、语音驱动动画技术和有感情的语音合成技术,满足非 IP 型虚拟数字人(虚拟教师、虚拟医生等)的生产。

魔珐科技的商业模式,恰好满足上文所述的那种 " 快速批量地生产非 IP 型虚拟数字人 " 的需求。这也就意味着,个性化定制式的解决方案正在随着各个虚拟数字人厂商对行业的理解更加深入,逐渐演变成为标准化的、可复制的、通用型解决方案。这种全栈化能力或许无法极为深入地满足 B 端 C 端纷繁复杂的需求,但这种在多场景快速部署虚拟数字人的能力一定是未来实现元宇宙的必要条件。

关键词

24快报
JSON抓取失败