数字人

数字人主播上线了,元宇宙时代我们还需要新闻主播吗

近日,一条#AI女主播在线发起绕口令挑战#的视频登上了微博热搜,视频里,虚拟主播展示了一段高难度绕口令式新闻播报,引发了网友的热烈讨论,纷纷感叹“AI数字人太逼真了!”

近日,一条#AI女主播在线发起绕口令挑战#的视频登上了微博热搜,视频里,虚拟主播展示了一段高难度绕口令式新闻播报,引发了网友的热烈讨论,纷纷感叹“AI数字人太逼真了!”

而这位刚一上岗就吸睛无数的数字人主播正是上海人民广播电台与腾讯在线智能视频创作平台“智影”联合推出的虚拟主播“长小姣”。 在过去两个多月的时间里,长小姣”活跃在长三角之声的系列短视频《科技有数》中,在延续传统媒体严谨态度、通俗表达的同时,充分发挥虚拟主播不受时空限制的优势,第一时间将科技前沿动态传递给受众,语态鲜活、播报流畅、情感表达立体,让人耳目一新。

第一次出镜,她给观众带来有关“奥密克戎新变种或能逃避免疫保护”的最新研究。至今,她出镜的相关视频播放量、话题阅读量已破3300万。她的出现,不仅对于观众而言是一种特别的观看体验,对于长三角之声,也是一次大胆的技术尝试。

特别主播背后的故事

数字人指的是基于CG(Computer Graphics,计算机图形)技术与人工智能技术打造出的数字化虚拟人物。AI主播长小姣就是由腾讯在线智能视频创作平台“智影”推出的,基于腾讯AI的超写实数字人建模、多模态识别及生成、实时面部动作生成及驱动、迁移学习等多项人工智能前沿技术,结合扫描还原、面部肌肉驱动、表情肢体捕捉等技术,有着高达98%的真人相似度。

数据显示,智影数字人唇形模型效果比真人唇形效果高2.34%,因此看上去更加自然,声音支持多情感、多方言、多风格朗读,令适配的内容类型也更加多元。

不同于目前大多靠动作捕捉驱动的数字人,智影数字人播报完全依靠AI算法进行驱动,只需输入文本内容,就能根据语义播报,并即时输出播报视频。目前可支持最高5000字文本配音转换,支持播报语音倍速、局部变速等效果,操作简单快捷,更利于市场的接入与使用。

上海人民广播电台长三角之声作为全国首个由省级电台创办的区域广播,始终在不断探索技术赋能下的媒体融合。继2021年将阿基米德智能语音虚拟主播系统应用于广播新闻专栏、并联动长三角14个城市的广播频率共同播出之后,2022年疫情期间,长三角之声首次尝试虚拟数字人技术,上线专属形象“长小姣”。

长三角之声执行总监殷月萍介绍,长小姣在试水阶段主要服务于长三角之声的各类新媒体平台,包括但不限于官方微博、视频号等,内容产品方向主要是以资讯类播报为主,聚焦科创、财经等领域。转正后,长小姣在广播端也有了自己的专栏,在科创垂类节目《思创空间》中开设了有关科创产业知识普及的全媒体专栏《姣姣教教我》,并继续在微博、视频号、阿基米德客户端等平台同步更新。

以往,对于由主持人出镜的资讯类产品,常规的操作模式是:选题策划、文案撰写、视频脚本撰写、主持人服化、拍摄录制、素材剪辑、后期合成。所需要的设备包括:拍摄设备、剪辑软件、电脑等。

同样是疫情期间长三角之声推出的科普短视频,由主持人出镜录制的短视频产品完成上述流程需要2位员工、整体耗时根据选题内容的不同约2-3小时,使用虚拟数字人主播及智能视频创作系统之后的生产流程可由1位员工完成,整体耗时约30分钟。

“长小姣”的到来,令长三角之声短视频制播效率得到大幅提升,大大缩减了时间和技术成本,提升信息传播范围和效率。从出镜脚本到语气语态调整、表情驱动等等,通过编辑在系统中输入文字、搭配智影的云端智能视频创作工具系统,就可以一站式生成堪比真人主播的新闻播报内容。

虚拟主播改变了什么?

毫无疑问,有了不断迭代的新兴技术的加持,可以令传统媒体的内容生产更加“智能”。利用技术推动媒体融合,提升创作效率——这也是长三角之声选择与腾讯智影合作的原因。

智影技术负责人赵达介绍,事实上数字人播报只是智影的一个功能,非常适合想通过人像来提升视频表现效果但又不想真人出境的创作者,并且与市面上多数满足企业定制的数字人不同,智影数字人是真正意义上面向所有用户免费开放。作为在线视频智能剪辑平台,智影是一款真正通过技术提升创作者效率的工具,支持视频剪辑、素材库、AI文本配音、AI数字人播报、自动字幕识别等功能,通过技术帮助创作者提升创作效率,进而更好地进行视频化的表达。

殷月萍认为,我们并不需要进行“主播是不是会被完全取代”这样的讨论,“随着人工智能技术的迭代,如今的数字人技术无论是从仿真度还是从交互感,都比前两年具备了更好的使用体验。即便如此,在对内容和直播环境灵活处理、和受众情感交流、复杂创意过程方面,是很难取代人类的。“

她认为,“作为广播媒体,从单一音频产品转向图文音视频全产品形态,人员技能本身就在转型提升,而对于新兴技术的应用,更是对媒体深融的赋能。我们比较的并不是主播是真人还是数字人,抑或这两者之间的优劣,而是依托数字人主播背后的人工智能前沿技术,让传统媒体所从事的信息采编、音视频及数据可视化产品制作工作的生产流程更加高效、便捷。“

数字人和人类主播的工作是相辅相成的——数字人的应用,让媒体人在处理信息发布得以更加及时、内容产品形态更加多元的同时,可以有更多精力投入到创造性工作中。

也正因此,随着元宇宙概念被追捧,虚拟数字人也走进大众视野。不仅在媒体行业,数字人主播成为风潮,它还有更大的应用场景想象空间。从目前落地场景看,数字人适合新闻播报、会展主持、虚拟客服等场合,并且已在手语解说、互联网法院、金融客服、会议会展、媒体融合等多个领域得以应用,有效降低了内容生产成本,提升信息传播范围和效力,创造了良好的经济和社会效益。

比如,除了智影数字人在传统播报、短视频创作场景落地外,腾讯AI交互部还基于业内领先的手语技术打造3D手语数字人,2021年在业内首发后受到社会各界关注,多次在冬奥会、冬残奥会以及王者荣耀比赛等活动中提供直播解说服务,为听障人士提供无差别参会体验,帮助听障人士更好的融入社会。

就如殷月萍所言,“相信传统媒体的数字化转型势必成为以技术赋能媒体深度融合的大势所趋,“5G时代+人工智能,毫无疑问带来了更多机遇。短短两年,我们看到“虚拟数字人”从局部试水、个别行业应用,到现在越来越多的场景,仅传统媒体的应用就不仅有新闻播报、短视频制作,还有娱乐节目、直播带货等等。各种形态的虚拟数字人出现在千行百业是第三产业智能化趋势的一个缩影。

随着应用场景的逐步扩展,技术越发多元、复杂,相应的内容支撑的需求也就会随之产生。未来,技术及应用场景的丰满将创造了更多的内容创作空间。

量子位智库发布的《虚拟数字人深度产业报告》预测,2030年,我国虚拟数字人整体市场规模将达到2700亿。其中,身份型虚拟数字人将占据主导地位,约1750亿,服务型虚拟数字人(以功能性为主,替代真人服务)总规模超过950亿。

此次智影与长三角之声的合作,称得上是持续提高传统媒体制播效率和智能化水平的典范,也为新时代新闻生产创造了更多可能性。

24快报
JSON抓取失败