产业

科大讯飞正式发布了星火认知大模型V3.0

从具体的数据维度上看,星火3.0在工业设计、计算机、汽车工程、教育、零售、法律、医学,七大领域全面超越ChatGPT,甚至在医学和法律两个领域超越GPT-4。

10月24日,科大讯飞正式发布了星火认知大模型V3.0,董事长刘庆峰称:星火V3.0已整体超越ChatGPT,甚至部分领域超越GPT-4。

在振奋人心之余,有网友表示质疑,认为讯飞在吹牛。

01.发布会的遥遥领先

关于星火V3.0如何超越ChatGPT,发布会现场展示了一份由国务院发展研究中心国研经济研究院的横评报告。

其中显示,星火大模型V3.0综合能力超越ChatGPT,国内领先,国际一流。

从具体的数据维度上看,星火3.0在工业设计、计算机、汽车工程、教育、零售、法律、医学,七大领域全面超越ChatGPT,甚至在医学和法律两个领域超越GPT-4。

这样的成绩确实让人眼前一亮。

另据介绍,此次发布的星火V3.0,在文本生成、语言理解、知识问答、教学能力等七大能力均持续提升。

也许是过往有太多大模型的评测排名,并且相当混乱,比如SuperClue、OpenCompass、C-Eval等等,经常能看到超越GPT-4的大模型出现,并且名次变动幅度过大,让用户完全没法相信所谓的排名。

这其中主要和参数量,以及评测集的侧重点不同等因素有关,当然也有一些大模型存在刷榜的行为。

至于星火V3.0是否真的全面超越ChatGPT,并且部分领先GPT-4,这次的排名当然是一个参考。但个人认为不用太在意排名,后续自己的使用体验是可以说明一切的。

在这次发布会,除了星火V3.0之外,科大讯飞还有多个行业大模型首次发布,包括科技文献大模型、启发互动式英语AI答疑辅学、讯飞星火医疗大模型,并且升级了智能编程助手iFlyCode2.0,亮相业界首个大模型+具身智能的人形机器人。

02.利润大降、股市大跌

科大讯飞ALL IN AI以来,变化不可谓不大。但与此同时,也不得不承认,科大讯飞近年的状况确实不好。

10月20日,讯飞发布了2023年三季度财报。数据显示,公司前三季度实现营收同比下降0.37%,归母净利润只有9936.21万元,同比大幅下降76.36%。

一方面是大力的转型投入,一方面是盈利严重不足,到底AI业务什么时候能给科大讯飞带来实实在在的收入支撑,是一个不得不考虑的问题。

就在发布会时间,科大讯飞午后股市触及跌停,这也反映出市场的态度。

数据显示,截至今年8月份,我国已发布的大模型达156个,其中10亿级参数规模以上大模型超过80个,显然,激烈的竞争格局已经形成。

不难预料,接下来,科大讯飞的日子并不好过,星火3.0超越ChatGPT是否代表着科大讯飞的崛起,也还是个未知数。

24快报
JSON抓取失败