观点

盘古大模型3.0正式掀起行业高潮!

未来的世界将是什么样子?我们认为华为一直以来坚持的愿景和使命已经给出了答案:把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。

自去年底ChatGPT爆火以来,没有哪个企业能够抵挡住AI大模型带来的诱惑。截至目前,国内已有近百个大模型发布,这其中整体可以分为两类,一类是ChatGPT掀起风口后临时起意开启的项目;另一类是已有多年积累,只是选择在此时祭出。

华为正是后者中的强者,经过数次迭代,盘古大模型3.0正式掀起行业高潮!

盘古3.0,遥遥领先

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。作为一家名声在外的企业,华为的业务领域十分广泛,除了通信与手机等广被知晓外,在AI方面,华为云推出的盘古大模型也是一个独特的存在。

回顾过去,华为盘古大模型早在2020年就已启动研发,2021年4月正式发布。

2023年7月7日下午,在华为开发者大会2023(Cloud)上,盘古大模型3.0正式揭开面纱,“为行业而生”的定位成为其最大的亮点。

在发布会上,华为常务董事、华为云CEO张平安等对盘古大模型进行了全面阐述,称其“不作诗,只做事”,并喊出口号“AI for Industries”。

作为中国首个全栈自主的AI大模型,盘古3.0包括“5+N+X”三层架构,分别对应L0基础大模型、L1行业大模型、L2场景模型。

L0层是五个基础大模型,分别为NLP、多模态、CV、预测、科学计算大模型,提供满足行业场景中的多种技能需求。

盘古NLP大模型

业界首个超千亿参数的中文预训练大模型,利用大数据预训练、对多源丰富知识相结合,并通过持续学习吸收海量文本数据,不断提升模型的效果。

功能上,盘古NLP大模型拥有海量数据集,通过对中文词汇、语法、语义等特征的深度分析,持续优化基础模型,打造业界最强中文理解/生成能力;优秀的推理能力,采用文本+代码融合训练的方式,不仅需要从文本中提取信息,还需要理解代码的语义和逻辑及与文本之间的关系,提升思维链推理能力;多任务促进,不同任务间具备强大的迁移能力,它所掌握的知识和技能可以轻松地转移到其他相关任务中,帮助模型更快地学习新任务,循环促进优化;多模型调优,支持在不同领域任务中分别使用小模型进行特定领域的训练和优化,提高模型的使用效率和准确性,优质完成多领域任务;多插件补齐,LLM成为连接应用生态的中枢,支持如知识图谱,搜索,符号引擎等,补足机制性缺陷,提高盘古NLP大模型整体性能;全场景覆盖,支持行业知识问答,文案创作等多项能力,覆盖政务、金融、电商、能源等领域,低使用门槛助力多场景AI应用落地。

盘古CV大模型

基于海量图像、视频数据和盘古独特技术构筑的视觉基础模型,赋能行业客户利用少量场景数据对模型微调即可实现特定场景任务。

该模型支持图像分类、物体检测、姿态估计等近10种微调任务,覆盖大部分视觉感知场景;可根据提示对图片中的目标进行检测,解决场景碎片化问题,无需提供训练数据;可根据提示对图片中的目标进行分割,常在辅助标注、AIGC等场景应用。

CV大模型结合数据检索及数据增广技术,相对传统训练方式,数据需求减少80%以上;受益于更好的语义对齐效果,在小样本学习上表现优异,显著超越对比方法;利用行业模型高效表征及数据筛选能力,数据处理效率提升5倍以上。

盘古多模态大模型

融合语言和视觉跨模态信息,实现图像生成、图像理解、3D生成和视频生成等应用,面向产业智能化转型提供跨模态能力底座。

多模态大模型功能上原生支持中文,拥有亿级中文图文,百万中文关键词,更佳中文理解能力。可以更精准理解语义,实现精准图文描述、对齐语义理解、智能语境识别。也更具自然美感,多模态多尺度训练,逼近自然美感生成内容。拥有更强泛化性,适应各种复杂的应用场景和用户需求。并且基于昇腾云服务,全栈自主可控,也支持行业客户二次训练专属模型,打造大模型体验。

盘古预测大模型

面向结构化数据,基于神经网络Transformer架构,通过任务理解、模型推荐、模型融合技术,构建通用的预测能力。

该模型通过对数据元特征进行建模,得到更准确和全面的数据信息,进一步优化解决方案,提高模型能力。基于下游任务数据集的元特征,可通过预训练的搜索推荐模型,得到更适配的预处理方式和基模型集合。通过动态图对选择的基模型输出结果进行融合,得到基模型的最佳融合方式,进一步提升任务性能。

盘古科学计算大模型

面向气象、医药、水务、机械、航天航空等领域,融合AI数据建模和AI方程求解的方法;从海量的数据中提取出数理规律,使用神经网络编码微分方程;使用AI模型更快更准的解决科学计算问题

模型使用3D Earth-Specific Transformer基本框架,对输入的13×1440×721×5的高空变量和1440×721×4的地表变量进行关联训练,精准识别大气中不同高度的气象特征和相互关系;基于盘古药物分子大模型,以参考化合物为起点,支持80+种属性限制约束,从参考化合物到改造化合物的类药性质一览无余,方便迭代优化,得到性质更优、结构新颖的化合物;基于盘古药物分子大模型,在秒级内完成化合物的 ADMET 相关的 80 多种成药性质的预测以及药物可合成性的分数评估,以雷达图的方式直观展示,更好地辅助药物分子设计。

华为云盘古气象大模型研究成果在《Nature》正刊发表

L1层是N个行业大模型,如政务、金融、制造、药物分子、矿山、铁路、气象等大模型。除提供以上使用行业公开数据训练的行业通用大模型外,还可以基于客户自有数据,在L0和L1层上训练专有大模型。

L2层是为客户提供的更多细化场景模型,如政务热线、网点助手、供应链物流、先导药物筛选、台风路径预测等,为客户提供“开箱即用”的模型服务。

另外,还有一点值得关注的是,盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

从这一系列的产品特征中不难发现AI for Industries的决心,也正是因为如此,盘古大模型已经在政务、金融、制造、煤矿、铁路、制药、气象等各行各业投入使用。

以正式商用的矿山大模型为例,华为盘古解决了人工智能在矿山领域落地难的问题。通过引入 AI 大模型视觉识别能力,卸压钻孔施工质量进行智能分析,辅助防冲部门进行防冲卸压工程规范性验证,降低了82%的人工审核工作量,并将原本需要3天的防冲卸压施工监管流程缩短至10分钟,实现了防冲工程100%验收率。

在2023世界人工智能大会上,华为轮值董事长胡厚崑就曾表示,华为云盘古大模型面向ToB千行百业。华为人工智能的发展关键是走深向实,着力点放在让人工智能为千行百业的生产活动服务,为科研创新服务。

当然,盘古大模型也并非完全抛弃C端用户。

8月4日,华为开发者大会正式发布华为鸿蒙4(HarmonyOS 4),该操作系统与盘古大模型进行了融合,以改进人机交互。

特别是全新的AI小艺可以通过对自然对话的理解,识别出用户意图,很多操作不需要用户用专业的术语表达,小艺都可以明白并执行。并且AI小艺可以通过语音及文字交互,帮用户整理资讯、辅助生成文案生成、图片二次创作等。

遥遥领先的背后

从成为5G王者,到芯片实现全面突破,再到盘古大模型的强势入局,有太多的因素铸就华为如今的实力,而其中最不容忽视的是研发。

8月,华为发布2023年上半年财报,数据显示上半年华为营收3082.90亿元,同比增长3.2%,净利润465.23亿元,同比暴涨218%。而研发投入达到826.04亿元,同比增长4.4%。

官方数据显示,华为近十年累计投入的研发费用超过人民币9773亿元,2022年研发费用支出约为人民币1,615亿元,占全年收入的25.1%。

另外,2022年底研发员工约11.4万名,占总员工数量的55.4%,在全球共持有有效授权专利超过12万件。

这惊人的数据背后所展现的不仅是华为对于技术的卓越追求,是雄厚实力的最佳映射,更是深耕底层的决心。

因此,华为才能在多个领域爆发出惊人的成就。

竟是元宇宙“全才”

也许是在其传统业务上太过耀眼,使得华为在新领域的地位被掩盖,比如元宇宙。

元宇宙是众多高新技术融合的产物,是技术进步的必然趋势。一般认为,元宇宙包括六大核心技术,分别是:人工智能技术、网络及运算技术、区块链技术、交互技术、电子游戏技术、物联网技术。是这些技术的发展推动了元宇宙的进步,谁在这些技术领域拥有一席之地,谁就将在未来的元宇宙产业中占据重要地位。

而华为就是这么一个以技术见长的企业,并且这六项技术一个不落。

人工智能方面前文已作介绍,这里不再赘述。网络及运算、物联网技术是华为的传统强项,华为的5G冠绝全球,云计算、边缘计算、IoT同样出众。

区块链技术方面,华为拥有自家区块链平台,基于开源技术,构建多领域、多场景的区块链方案。今年2月在印尼举行的华为云亚太区合作伙伴领袖峰会上,华为云还牵头启动了Metaverse & Web3.0联盟。

交互方面,华为近年还发布了数款XR硬件产品,比如华为VRGlass、华为 VR Glass 6DOF,以及Vision Glass等。甚至6月还公布一项脑机接口专利。

电子游戏技术方面,华为拥有凤凰引擎,开源了数据虚拟化引擎华为河图,还也和北京首钢园合作上线“首钢园元宇宙”。

细数下来,华为在这六大技术方面都有技术积累和布局。专利方面,2月初,韩国特许厅曾对全球国家的元宇宙相关专利进行统计,华为的专利数量全球第四,国内排名第一。

综上所述,说华为是国内元宇宙企业的“最强王者”也毫不过分。

毋庸置疑的未来

未来的世界将是什么样子?我们认为华为一直以来坚持的愿景和使命已经给出了答案:把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。

2023年初,国家发布《数字中国建设整体布局规划》,其中提到数字中国建设的目标是以信息化、智能化、网络化等手段,推动各行业的数字化转型。而构建数字经济体系和数字社会体系是政策措施的重点内容。

华为的愿景契合了数字中国、数字经济的国家战略,也是元宇宙等新兴业态发展的核心所在。

另据数据,2022 年我国数字经济规模达到 50.2 万亿元,同比名义增长 10.3%,连续 11 年显著高于同期 GDP名义增速。并且数字经济占 GDP 比重达到 41.5%。

从这些不难看出,未来市场的机遇所在,华为未来的路又将多么宽广,也正是这些让我们笃定华为的愿景终将实现,因为华为的愿景正是这个时代的愿景。

当然,华为的道路也并非一帆风顺,未来还将有哪些艰难险阻,欢迎与我们一同探讨。

自去年底ChatGPT爆火以来,没有哪个企业能够抵挡住AI大模型带来的诱惑。截至目前,国内已有近百个大模型发布,这其中整体可以分为两类,一类是ChatGPT掀起风口后临时起意开启的项目;另一类是已有多年积累,只是选择在此时祭出。

华为正是后者中的强者,经过数次迭代,盘古大模型3.0正式掀起行业高潮!

盘古3.0,遥遥领先

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。作为一家名声在外的企业,华为的业务领域十分广泛,除了通信与手机等广被知晓外,在AI方面,华为云推出的盘古大模型也是一个独特的存在。

 

回顾过去,华为盘古大模型早在2020年就已启动研发,2021年4月正式发布。

2023年7月7日下午,在华为开发者大会2023(Cloud)上,盘古大模型3.0正式揭开面纱,“为行业而生”的定位成为其最大的亮点。

在发布会上,华为常务董事、华为云CEO张平安等对盘古大模型进行了全面阐述,称其“不作诗,只做事”,并喊出口号“AI for Industries”。

作为中国首个全栈自主的AI大模型,盘古3.0包括“5+N+X”三层架构,分别对应L0基础大模型、L1行业大模型、L2场景模型。

 

L0层是五个基础大模型,分别为NLP、多模态、CV、预测、科学计算大模型,提供满足行业场景中的多种技能需求。

§ 

盘古NLP大模型

§ 

业界首个超千亿参数的中文预训练大模型,利用大数据预训练、对多源丰富知识相结合,并通过持续学习吸收海量文本数据,不断提升模型的效果。

功能上,盘古NLP大模型拥有海量数据集,通过对中文词汇、语法、语义等特征的深度分析,持续优化基础模型,打造业界最强中文理解/生成能力;优秀的推理能力,采用文本+代码融合训练的方式,不仅需要从文本中提取信息,还需要理解代码的语义和逻辑及与文本之间的关系,提升思维链推理能力;多任务促进,不同任务间具备强大的迁移能力,它所掌握的知识和技能可以轻松地转移到其他相关任务中,帮助模型更快地学习新任务,循环促进优化;多模型调优,支持在不同领域任务中分别使用小模型进行特定领域的训练和优化,提高模型的使用效率和准确性,优质完成多领域任务;多插件补齐,LLM成为连接应用生态的中枢,支持如知识图谱,搜索,符号引擎等,补足机制性缺陷,提高盘古NLP大模型整体性能;全场景覆盖,支持行业知识问答,文案创作等多项能力,覆盖政务、金融、电商、能源等领域,低使用门槛助力多场景AI应用落地。

§ 

盘古CV大模型

§ 

基于海量图像、视频数据和盘古独特技术构筑的视觉基础模型,赋能行业客户利用少量场景数据对模型微调即可实现特定场景任务。

该模型支持图像分类、物体检测、姿态估计等近10种微调任务,覆盖大部分视觉感知场景;可根据提示对图片中的目标进行检测,解决场景碎片化问题,无需提供训练数据;可根据提示对图片中的目标进行分割,常在辅助标注、AIGC等场景应用。

CV大模型结合数据检索及数据增广技术,相对传统训练方式,数据需求减少80%以上;受益于更好的语义对齐效果,在小样本学习上表现优异,显著超越对比方法;利用行业模型高效表征及数据筛选能力,数据处理效率提升5倍以上。

§ 

盘古多模态大模型

§ 

融合语言和视觉跨模态信息,实现图像生成、图像理解、3D生成和视频生成等应用,面向产业智能化转型提供跨模态能力底座。

多模态大模型功能上原生支持中文,拥有亿级中文图文,百万中文关键词,更佳中文理解能力。可以更精准理解语义,实现精准图文描述、对齐语义理解、智能语境识别。也更具自然美感,多模态多尺度训练,逼近自然美感生成内容。拥有更强泛化性,适应各种复杂的应用场景和用户需求。并且基于昇腾云服务,全栈自主可控,也支持行业客户二次训练专属模型,打造大模型体验。

§ 

盘古预测大模型

§ 

面向结构化数据,基于神经网络Transformer架构,通过任务理解、模型推荐、模型融合技术,构建通用的预测能力。

该模型通过对数据元特征进行建模,得到更准确和全面的数据信息,进一步优化解决方案,提高模型能力。基于下游任务数据集的元特征,可通过预训练的搜索推荐模型,得到更适配的预处理方式和基模型集合。通过动态图对选择的基模型输出结果进行融合,得到基模型的最佳融合方式,进一步提升任务性能。

§ 

盘古科学计算大模型

§ 

面向气象、医药、水务、机械、航天航空等领域,融合AI数据建模和AI方程求解的方法;从海量的数据中提取出数理规律,使用神经网络编码微分方程;使用AI模型更快更准的解决科学计算问题

模型使用3D Earth-Specific Transformer基本框架,对输入的13×1440×721×5的高空变量和1440×721×4的地表变量进行关联训练,精准识别大气中不同高度的气象特征和相互关系;基于盘古药物分子大模型,以参考化合物为起点,支持80+种属性限制约束,从参考化合物到改造化合物的类药性质一览无余,方便迭代优化,得到性质更优、结构新颖的化合物;基于盘古药物分子大模型,在秒级内完成化合物的 ADMET 相关的 80 多种成药性质的预测以及药物可合成性的分数评估,以雷达图的方式直观展示,更好地辅助药物分子设计。

 

华为云盘古气象大模型研究成果在《Nature》正刊发表

L1层是N个行业大模型,如政务、金融、制造、药物分子、矿山、铁路、气象等大模型。除提供以上使用行业公开数据训练的行业通用大模型外,还可以基于客户自有数据,在L0和L1层上训练专有大模型。

L2层是为客户提供的更多细化场景模型,如政务热线、网点助手、供应链物流、先导药物筛选、台风路径预测等,为客户提供“开箱即用”的模型服务。

另外,还有一点值得关注的是,盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

从这一系列的产品特征中不难发现AI for Industries的决心,也正是因为如此,盘古大模型已经在政务、金融、制造、煤矿、铁路、制药、气象等各行各业投入使用。

以正式商用的矿山大模型为例,华为盘古解决了人工智能在矿山领域落地难的问题。通过引入 AI 大模型视觉识别能力,卸压钻孔施工质量进行智能分析,辅助防冲部门进行防冲卸压工程规范性验证,降低了82%的人工审核工作量,并将原本需要3天的防冲卸压施工监管流程缩短至10分钟,实现了防冲工程100%验收率。

 

在2023世界人工智能大会上,华为轮值董事长胡厚崑就曾表示,华为云盘古大模型面向ToB千行百业。华为人工智能的发展关键是走深向实,着力点放在让人工智能为千行百业的生产活动服务,为科研创新服务。

 

当然,盘古大模型也并非完全抛弃C端用户。

8月4日,华为开发者大会正式发布华为鸿蒙4(HarmonyOS 4),该操作系统与盘古大模型进行了融合,以改进人机交互。

特别是全新的AI小艺可以通过对自然对话的理解,识别出用户意图,很多操作不需要用户用专业的术语表达,小艺都可以明白并执行。并且AI小艺可以通过语音及文字交互,帮用户整理资讯、辅助生成文案生成、图片二次创作等。

遥遥领先的背后

从成为5G王者,到芯片实现全面突破,再到盘古大模型的强势入局,有太多的因素铸就华为如今的实力,而其中最不容忽视的是研发。

8月,华为发布2023年上半年财报,数据显示上半年华为营收3082.90亿元,同比增长3.2%,净利润465.23亿元,同比暴涨218%。而研发投入达到826.04亿元,同比增长4.4%。

 

官方数据显示,华为近十年累计投入的研发费用超过人民币9773亿元,2022年研发费用支出约为人民币1,615亿元,占全年收入的25.1%。

另外,2022年底研发员工约11.4万名,占总员工数量的55.4%,在全球共持有有效授权专利超过12万件。

这惊人的数据背后所展现的不仅是华为对于技术的卓越追求,是雄厚实力的最佳映射,更是深耕底层的决心。

因此,华为才能在多个领域爆发出惊人的成就。

竟是元宇宙“全才”

也许是在其传统业务上太过耀眼,使得华为在新领域的地位被掩盖,比如元宇宙。

元宇宙是众多高新技术融合的产物,是技术进步的必然趋势。一般认为,元宇宙包括六大核心技术,分别是:人工智能技术、网络及运算技术、区块链技术、交互技术、电子游戏技术、物联网技术。是这些技术的发展推动了元宇宙的进步,谁在这些技术领域拥有一席之地,谁就将在未来的元宇宙产业中占据重要地位。

而华为就是这么一个以技术见长的企业,并且这六项技术一个不落。

人工智能方面前文已作介绍,这里不再赘述。网络及运算、物联网技术是华为的传统强项,华为的5G冠绝全球,云计算、边缘计算、IoT同样出众。

区块链技术方面,华为拥有自家区块链平台,基于开源技术,构建多领域、多场景的区块链方案。今年2月在印尼举行的华为云亚太区合作伙伴领袖峰会上,华为云还牵头启动了Metaverse & Web3.0联盟。

交互方面,华为近年还发布了数款XR硬件产品,比如华为VRGlass、华为 VR Glass 6DOF,以及Vision Glass等。甚至6月还公布一项脑机接口专利。

 

电子游戏技术方面,华为拥有凤凰引擎,开源了数据虚拟化引擎华为河图,还也和北京首钢园合作上线“首钢园元宇宙”。

细数下来,华为在这六大技术方面都有技术积累和布局。专利方面,2月初,韩国特许厅曾对全球国家的元宇宙相关专利进行统计,华为的专利数量全球第四,国内排名第一。

综上所述,说华为是国内元宇宙企业的“最强王者”也毫不过分。

毋庸置疑的未来

未来的世界将是什么样子?我们认为华为一直以来坚持的愿景和使命已经给出了答案:把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。

2023年初,国家发布《数字中国建设整体布局规划》,其中提到数字中国建设的目标是以信息化、智能化、网络化等手段,推动各行业的数字化转型。而构建数字经济体系和数字社会体系是政策措施的重点内容。

华为的愿景契合了数字中国、数字经济的国家战略,也是元宇宙等新兴业态发展的核心所在。

另据数据,2022 年我国数字经济规模达到 50.2 万亿元,同比名义增长 10.3%,连续 11 年显著高于同期 GDP名义增速。并且数字经济占 GDP 比重达到 41.5%。

从这些不难看出,未来市场的机遇所在,华为未来的路又将多么宽广,也正是这些让我们笃定华为的愿景终将实现,因为华为的愿景正是这个时代的愿景。

当然,华为的道路也并非一帆风顺,未来还将有哪些艰难险阻,欢迎与我们一同探讨。

24快报
JSON抓取失败