产业

人工智能赋能各行业 新壹科技助力大众体验“AI+视频”红利

从写代码到讲故事,从撰写文章到自动生成视频…生成式人工智能正从底层赋能千行万业。在视听领域,这些技术正逐渐呈现出重塑甚至颠覆数字内容生产方式的趋势。移动互联网时代,短视频社交媒体平台的兴起,验证了技术驱动下,内容创作门槛降低、生产力提升带来价值创造的巨大潜力。

从写代码到讲故事,从撰写文章到自动生成视频…生成式人工智能正从底层赋能千行万业。在视听领域,这些技术正逐渐呈现出重塑甚至颠覆数字内容生产方式的趋势。移动互联网时代,短视频社交媒体平台的兴起,验证了技术驱动下,内容创作门槛降低、生产力提升带来价值创造的巨大潜力。

聚焦AI视频生成领域,就不得不提起新壹科技。新壹科技成立于2021年,由「一下科技」孵化。依托人工智能技术,公司主要面向C端内容创作者,以及B端、G端客户提供系列AIGC视频应用及服务。

一下科技是在移动互联网时代,最早抓住短视频机遇的企业之一,秒拍视频、小咖秀等系列产品在行业有口皆碑。新壹科技CEO雷涛介绍,公司的创始团队也早在2020年底,就将研发重心转向AIGC视频生成领域,定位也从专注移动视频应用的公司,转向以视频为核心应用场景的人工智能公司。回顾过去十年,雷涛认为,短视频社交媒体成功的核心逻辑在于“技术赋能下,产品更好地满足了创作者的创作需求”。

关于AIGC时代,AI+视频应用的成长路径,雷涛表示:“从打磨好产品的工具属性,获得初始用户,到逐步赋予其观看属性、社交属性,这条路径仍然适用。”但是,在他看来,目前AIGC还处于非常早期的阶段,AI+视频应用更多呈现工具属性特征,难以预判下一阶段何时到来。

因此,新壹科技将“把AI做成视频领域生产力工具”作为新的定位下,公司要达成的首要目标。为此,公司主要做了两方面调整:一是基于新定位,调整了组织架构,不再按做视频应用的逻辑划分部门;二是,在原有AI技术能力基础上,重新搭建AI视频生成的技术底座。

“新壹科技的创始团队经历了视频应用从PGC到UGC的整个过程。我们内部早在2020年就达成共识,认为视频领域向后发展,会朝AI生成的方向走。”新壹科技研发副总裁、AI项目负责人陈鹏表示,在2020年底之前,公司的AI技术研发主要为视频应用打配合,专注内容推荐算法,以及服务安审团队。

在此之后,新壹科技一方面抽象出了视频识别、文本处理等方面沉淀的技术方案;另一方面,调研了市面上所有相关AI模型,并选择了适配的新一代文本、图像生成等开源模型,对其进行训练调优。据介绍,公司已结合自研AI模型和训练调优后的开源模型,开发了「新壹」视频大模型,可同时处理文本、音频、视频、图像多种输入模态。基于此,新壹科技建立了多模型调度的AIGC智能引擎「秒创」,支持通过意图分析,任务拆解,模型选择等中控流程,完成多模态AIGC内容生成任务处理。

产品、服务层面,围绕上述AI技术底座,新壹科技构建了「秒创」智能内容生成平台、「千心」智能助手、「新壹」数字人平台等产品矩阵。同时,面向B端、G端,公司可以提供覆盖行业垂直模型训练、AI视频内容定制、2D、3D数字人等在内的综合解决方案。另外,雷涛透露,一款具备微社交属性的AIGC视频应用即将上线。

「一帧秒创」是新壹科技现阶段的主推产品之一,于2022年10月开放测试,并在今年3月正式上线运营,主要面向内容创作者和B端客户提供文本帮写、文字转语音、文生图、图文转视频等AI内容生成服务。“相较于移动互联网时代的视频应用,一帧秒创进一步降低了用户内容创作的门槛,提升了创作效率。”雷涛介绍道,产品满足小白用户上手使用的三个条件:

一是,用户可以使用文本帮写服务,完成视频文案撰写和脚本生成;

二是,消除了传统剪辑软件的时间轴概念,采用填空式视频制作方式,通过对文案、素材、AI语音、字幕等智能分析,在自动生成视频时间轴、完成视频素材匹配,能够满足用户的一键成片需求;

三是,2D数字人可以代替创作者出镜。雷涛表示,目前2D数字人制作成本也已降低到专业用户可接受的水平。

在这一视频生成模式下,视频素材质量和匹配精确度是关键。为此,新壹科技从过往积累的来自微博/秒拍、合作版权商以及公开来源的数十亿量级视频数据,提炼出千万量级的高质量结构化数据,搭建了视频素材库。素材提炼和后续素材匹配过程主要由公司自研的场景级、镜头级视频拆分、匹配算法和模型完成。

但同时,雷涛坦言,由于创作本身的自由度较高,不同创作者对同样的文本也会有不同的素材匹配需求,难以做到完全适配。他表示,对视频质量和个性化要求高的客户,也可选择自有素材替换。另外,为了丰富素材替换选项,新壹科技一方面正在打造激励机制,鼓励专业用户建立、分享自己的私有素材库;另一方面,基于对Stable Diffusion训练调优的模型向用户提供生成图像替换功能。同时,公司正跟进「Runway」的Gen2等视频生成模型的发展。雷涛认为,完全由机器生成视频素材尚需时日。

目前,一帧秒创已累计服务于200万+内容创作者,并实现了一定规模的营收水平。雷涛表示,前期用户除了公众号作者、头条号作者等C端专业用户和营销、传媒类小B客户,还包括视频小白用户。另外,公司已陆续开始与金融、医疗、文旅等多个行业的大型企业客户展开合作。

谈及竞争,雷涛表示,一方面,整体来讲海外产品还比较碎片化,集成度不够高。新壹科技旨在服务用户视频创作,功能覆盖面相对成熟,剪辑只是其中一环;另一方面,各家的切入点不同,比如百度是从自研模型切入,新壹科技更侧重应用层。另外,相较其他同类产品,一帧秒创定位更偏向于不会剪辑,甚至不会写视频脚本的普通用户。

先跑能否一定能赢?对这个问题,雷涛坦言:“不跑肯定赢不了。现在重要的不是考虑10年后怎么‘一览众山小’,想也没用,而是要踏实走好当下的每一步。”他表示,新壹科技现阶段的重点是做好产品工程化,一是素材库迭代,二是算法优化,同时跟紧先进技术发展动态,在此基础上逐步拓宽视频AIGC的应用场景,如偏向娱乐、社交的场景,把视频AIGC的能力交付给更多普通用户。

24快报
JSON抓取失败