数字孪生

360智脑总裁张向征:用数字人可大幅降低大模型使用门槛

国内大模型扎堆涌现的当下,应用也开始向垂直行业发展。前不久举行完大模型应用发布会的360智脑,近日又携数字人索菲亚亮相2023ChinaJoy AIGC大会。

财联社7月31日讯(记者 崔铭)国内大模型扎堆涌现的当下,应用也开始向垂直行业发展。前不久举行完大模型应用发布会的360智脑,近日又携数字人索菲亚亮相2023ChinaJoy AIGC大会。

2023ChinaJoy期间,360智脑总裁张向征在接受财联社记者专访时表示,用数字人可大幅降低大模型使用门槛。“比如数字名人,用户仅需一张图片,一段提示词就可以让360智脑角色代入创建属于自己的数字名人。用户可以穿越时空,与先贤实现开放式对话,也可以跟名著里的人物实现面对面的交流。同时,通过知识库和多模态增强的数字名人,还可以生成自拍照、生成视频、语音交流甚至是直播带货。还有数字员工,可以为每个职场人打造多种数字助理。360智脑可以成为你的营销总监,输出高质量的市场策划。也可以成为你的文案助手,撰写爆款文案。还可以成为你的商业分析师,行业分析材料轻松阅读掌握。”张向征表示。

据了解,360致力于企业级AI大模型解决方案,目前推出了税务行业标准大模型和企业服务行业科创大模型,未来也会应用到智慧医疗、智慧城市、智慧交通等多个场景。

但目前,大模型走向行业的过程中,仍面临不少挑战。张向征告诉记者,通用大模型训练的数据来自开源通用数据,训练数据的分布和垂直行业的数据分布是不一致的,因此需要用垂直行业的数据做进一步的训练和微调,对于垂直行业的特殊任务做针对性的数据挖掘补充和训练。

“为了保证垂直行业对知识的准确性,会通过知识增强的方式为大模型输入提供准确的行业知识,帮助大模型解决内容生成的事实幻觉问题。同时我们会开放针对垂直行业的插件能力进一步增强垂直行业的应用。”张向征表示。

据介绍,360智脑的数据以搜索为基础,包括了各个行业的精品垂直数据,也包括了通用网页里筛选出的高质量数据总计4T。

针对数据专业性、安全性问题,张向征提到,在提升语料质量方面,360智脑建立了高质量数据集的评价体系以及数据实验的机制,保证每一版数据的加工都有正向的结果。同时,通过不断迭代数据清洗的流程,如归一化、正文抽取、去重、安全信息脱敏,逐步提升数据的质量。

此外,360智脑还建立完善的内容风控和审核流程,提升大模型输出内容的安全性。并且标注大量优质微调和模型结果排序语料,通过基于人类反馈的强化,与人类价值观对齐,让模型输出的结果更安全可靠。通过持续的数据挖掘机制,保证训练语料的准确性和时效性。

24快报
JSON抓取失败