清华大学发布大模型综合性能评估报告：文心一言排名第二，通义千问排名第六 _快讯_新闻播报_元宇宙界

快讯

清华大学发布大模型综合性能评估报告：文心一言排名第二，通义千问排名第六

来源：财联社
2023-08-08 20:10

据公众号“清元宇宙”，清华大学沈阳教授团队近日发布了《大语言模型综合性能评估报告》，报告从生成质量、使用与性能、安全与合规三个维度对大语言模型进行评估，并深入分析不同大语言模型之间的优劣。

清华大学发布大模型综合性能评估报告：文心一言排名第二，通义千问排名第六

据公众号“清元宇宙”，清华大学沈阳教授团队近日发布了《大语言模型综合性能评估报告》，报告从生成质量、使用与性能、安全与合规三个维度对大语言模型进行评估，并深入分析不同大语言模型之间的优劣。

该报告总共对文心一言、讯飞星火、通义千问、昆仑天工、GPT-4、ChatGPT 3.5 和 Claude 七个大语音模型进行了评估分析。据综合性能评估结果显示，GPT-4 排名第一，文心一言和 ChatGPT 3.5 分别排名第二三位，阿里云通义千问则排在第六位。

关键词

相关阅读

苹果开始招募生成式 AI 人才，提供数十个大模型岗位

60

苹果开始招募生成式 AI 人才，提供数十个大模型岗位

by
2023-08-08

蒙牛发布首个全球营养健康领域模型

60

蒙牛发布首个全球营养健康领域模型

by
2023-08-08

易点天下与阿里云达成合作，联合打造行业专属大模型

60

易点天下与阿里云达成合作，联合打造行业专属大模型

by
2023-08-08

AI大模型来袭，智能客服变天？

60

AI大模型来袭，智能客服变天？

by
2023-08-07

元宇宙和大模型都少不了NVIDIA

60

元宇宙和大模型都少不了NVIDIA

by
2023-08-07

美踏控股发布虚拟人音舞社交人工智能大数据模型“心乐舞河”

60

美踏控股发布虚拟人音舞社交人工智能大数据模型“心乐舞河”

by
2023-08-07

AI大模型加持，全新鸿蒙智能座舱“遥遥领先”了吗？

60

AI大模型加持，全新鸿蒙智能座舱“遥遥领先”了吗？

by
2023-08-05

聆心智能发布超拟人大模型，使AI兼具“智商”与“情商”

60

聆心智能发布超拟人大模型，使AI兼具“智商”与“情商”

by
2023-08-05

美踏控股发布虚拟人音舞社交人工智能大数据模型“心乐舞河”

60

美踏控股发布虚拟人音舞社交人工智能大数据模型“心乐舞河”

by
2023-08-05

华为：小艺将具备AI大模型能力

60

华为：小艺将具备AI大模型能力

by
2023-08-04

24快报

可见可感可触当中关村论坛进入“元宇宙”

昨天 10:12

中关村发展集团总经理助理苗军：元宇宙在医疗、制造等领域的创新

前天 20:21

中关村论坛“元宇宙”引关注南中轴科技园率先培育产业基地

前天 20:20

Meta如果继续押注元宇宙，投资者可能会“用脚投票”

前天 13:11

把大三巴、大报恩寺搬上元宇宙 “新文旅”遇见“新科技”

前天 13:11

北京星光影视园组建元宇宙直播基地企业集团

前天 13:08

工体元宇宙现身2024中关村论坛年会沉浸体验点球大战

前天 13:08

Meta首款真正AR眼镜原型将超越现有产品设定预期

前天 12:51

网易瑶台打造2024中关村论坛元宇宙，一手参会体验来了！

前天 12:50

苹果终于也开源了！重磅发布OpenELM模型，搭载AI的iPhone就要来

前天 12:49

中国电子工业标准化技术协会发布元宇宙应用案例集

2024年4月26日 18:30

人形机器人企业“月泉仿生”完成千万元天使+轮融资

2024年4月26日 18:13

济南起步区发布73项产业机会清单，元宇宙产业机会5项

2024年4月26日 18:12

OPPO：XR探索暂停，AI成为全新战略重点

2024年4月26日 18:11

工业和信息化部：鼓励有条件的地区创建未来产业先导区

2024年4月26日 18:10

广东省开展基于元宇宙的标准化研究，标准研究成果比率达55%

2024年4月26日 18:08

论中西语境下元宇宙期许的向度差异与分化影响

2024年4月26日 14:00

英特尔：股价大跌约8%，新AI产品销售额将超过5亿美元

2024年4月26日 13:51

AI吸金能力强：红杉资本入局，马斯克xAI公司接近达成60亿美元融

2024年4月26日 13:50

谷歌市值增加近3000亿美元，将推动新模型的开发

2024年4月26日 10:54

JSON抓取失败