英伟达处理器正遥遥领先，英特尔紧随其后_产业_产业

产业

英伟达处理器正遥遥领先，英特尔紧随其后

来源：新浪VR
2023-11-14 21:38

英特尔还分享了一些数据，显示4节点Xeon系统（包含AMX矩阵引擎）可以在不到五分钟的时间内对图像生成器的稳定扩散进行微调。微调是将已经训练好的神经网络专门用于某项任务，例如，英伟达的芯片设计AI就是对现有大型语言模型NeMo的微调。

AI基准测试平台MLPerf最新训练测试结果显示，英伟达处理器正遥遥领先，英特尔紧随其后，谷歌则远远落在了后面。针对计算机系统训练机器学习神经网络的公平测试（apples-to-applestest），已全面进入生成式人工智能时代。

今年年初，MLPerf增加了一个用于训练大型语言模型（LLM）的测试，主要是针对GPT-3。而就在本月，MLPerf又增加了一个基于文本生成图像的测试Stable Diffusion。英伟达和英特尔的处理器参与了该基准测试，而在训练GPT-3时，谷歌也加入到了测试行列中。

PS：MLPerf（Machine Learning Performance）基准测试是由学术界和工业界共同组成的非营利性组织，旨在建立一个公平、透明且可复现的机器学习性能评估平台。该项目于2018年启动，得到了全球范围内众多知名学术机构和科技公司的支持与参与。其目标是为机器学习研究者和开发者提供一个统一的标准和基准测试工具，以促进机器学习系统的性能提升和相互比较。

三家公司都为这项任务投入了庞大的系统。其中，英伟达的10000GPU超级计算机是有史以来测试过的最大的超级计算机，而这种规模的超级计算机在生成式人工智能中是必不可少的。但即使这样，该计算机也需要八天的时间才能完全完成LLM的训练任务。

本次测试共计有19家公司和机构提交了200多项测试结果，测试结果表明在过去五个月中计算机处理器性能提升了2.8倍，自五年前MLPerf成立以来则提升了49倍。

10752个GPU的超级计算机

在MLPerf基准测试中，英伟达公司的H100 GPU系统继续占据主导地位。但最令人惊喜的是该公司新推出的人工智能超级计算机Eos，该计算机拥有高达10752个GPU。利用所有这些GPU完成GPT-3训练基准的任务，Eos只用了不到4分钟时间。微软的云计算部门Azure测试了一个大小完全相同的系统，结果却是仅以几秒之差落后于Eos。（Azure为GitHub的编码助手CoPilot和OpenAI的ChatGPT提供训练支持）。

Eos的GPU每秒可进行426亿亿次浮点运算（exaflops）。这些GPU与英伟达的Quantum-2 Infiniband互联，传输速度高达每秒110万亿字节。英伟达人工智能基准测试和云计算总监戴夫-萨尔瓦托雷说：“其速度和数据规模令人难以置信。这是一台能力惊人的机器。”

Eos将单台机器上绑定的H100 GPU数量增加了三倍，这三倍的增长换来了2.8倍的性能提升，即93%的扩展效率。高效的扩展是持续改进生成式人工智能的关键，而生成式人工智能每年都在以10倍的速度增长。

Eos所解决的GPT-3基准测试并不是对GPT-3的完整训练，因为MLPerf希望大多公司都能做到这一点。相反，Eos的任务是将系统训练到某个检查节点，以证明如果有足够时间的情况下，训练将能达到所需的准确度。

而这些训练确实需要时间。从以Eos在这4分钟内的训练速度推算，完成所有训练需要8天，而这还是在迄今为止最强大的人工智能超级计算机上完成的。如果是一台普通的512 H100，则需要4个月时间。

英特尔步步紧逼

英特尔提交了使用Gaudi 2加速芯片系统的测试结果，以及完全不使用加速芯片、仅使用第四代Xeon CPU系统的测试结果。与上一组训练基准相比，最大的变化是英特尔启用了Gaudi 2的8位浮点运算（FP8）功能。

过去10年中，GPU性能的提升主要归功于FP8等低精度数字的使用。在GPT-3和其他Transformer神经网络中使用FP8，其低精度不会影响准确性，这已经在英伟达H100的测试结果中得到了验证。现在，在Gaudi 2上也看到了这种提升。

英特尔Habana实验室首席运营官艾坦-梅迪纳表示：“我们预计使用FP8会带来90%的提升。最终结果超出了预期——384加速器集群的训练时间缩短了103%”

这一新成果使Gaudi 2系统的单芯片速度略低于英伟达系统的三分之一，是谷歌TPUv5e的三倍。而在新的图像生成基准测试中，Gaudi 2的速度也只有H100的一半左右。GPT-3是本轮唯一启用FP8的基准测试，但梅迪纳说他的团队正在努力为其他基准测试启用FP8。

梅迪纳继续说明，Gaudi 2的价格明显低于H100，因此在价格和性能的综合指标上具有优势。梅迪纳预计，随着下一代英特尔加速器芯片Gaudi 3的问世，这一优势将进一步扩大。该芯片将于2024年量产，采用与英伟达H100相同的半导体制造工艺。

另外，英特尔还提交了仅基于CPU的系统结果。同样，几项基准测试的训练时间都在几分钟到几小时之间。

除了MLPerf基准之外，英特尔还分享了一些数据，显示4节点Xeon系统（包含AMX矩阵引擎）可以在不到五分钟的时间内对图像生成器的稳定扩散进行微调。微调是将已经训练好的神经网络专门用于某项任务，例如，英伟达的芯片设计AI就是对现有大型语言模型NeMo的微调。

英伟达处理器正遥遥领先，英特尔紧随其后

关键词

相关阅读

英特尔助力医疗智能化高质量发展

英特尔和AMD先后发布第三季度财报证明个人电脑市场正在加速复苏

联想与英伟达公布重大计划：推出混合AI解决方案

英特尔正在为客户构建类似 ChatGPT 的人工智能应用

富士康与英伟达合作打造AI工厂——新型数据中心

梅赛德斯-奔驰宣布与英伟达合作

摩根士丹利：以暴涨两倍的英伟达为风向标 AI泡沫已逼近顶峰

AI大模型加持，全新鸿蒙智能座舱“遥遥领先”了吗？

钛媒体科股早知道：苹果、英伟达携手成立联盟，制定元宇宙3D图形标准

苹果、英伟达、皮克斯、Adobe等成立联盟以推行3D内容开放式标准

24快报

可见可感可触当中关村论坛进入“元宇宙”

中关村发展集团总经理助理苗军：元宇宙在医疗、制造等领域的创新

中关村论坛“元宇宙”引关注南中轴科技园率先培育产业基地

Meta如果继续押注元宇宙，投资者可能会“用脚投票”

把大三巴、大报恩寺搬上元宇宙 “新文旅”遇见“新科技”

北京星光影视园组建元宇宙直播基地企业集团

工体元宇宙现身2024中关村论坛年会沉浸体验点球大战

Meta首款真正AR眼镜原型将超越现有产品设定预期

网易瑶台打造2024中关村论坛元宇宙，一手参会体验来了！

苹果终于也开源了！重磅发布OpenELM模型，搭载AI的iPhone就要来

中国电子工业标准化技术协会发布元宇宙应用案例集

人形机器人企业“月泉仿生”完成千万元天使+轮融资

济南起步区发布73项产业机会清单，元宇宙产业机会5项

OPPO：XR探索暂停，AI成为全新战略重点

工业和信息化部：鼓励有条件的地区创建未来产业先导区

广东省开展基于元宇宙的标准化研究，标准研究成果比率达55%

论中西语境下元宇宙期许的向度差异与分化影响

英特尔：股价大跌约8%，新AI产品销售额将超过5亿美元

AI吸金能力强：红杉资本入局，马斯克xAI公司接近达成60亿美元融

谷歌市值增加近3000亿美元，将推动新模型的开发