勇夺第一！华为昇腾AI算力平台训练大模型效率超越英伟达A100

AI-5bei网6月18日报道丨罕见公布！华为高管对外透露昇腾AI算力平台的性能。

在上周6月5日，2024世界半导体大会暨南京国际半导体博览会上，华为旗下的江苏鲲鹏·昇腾生态创新中心COO王陶透露，基于Ascend算力芯片打造的昇腾算力集群，是国内目前唯一可支持训练千亿参数大模型的解决方案，其AI算力性能已经超过了市面主流使用的英伟达A100。

英伟达A100被认为是当今AI大模型的“摇篮”，是海内外90%以上的大模型首选的训练平台。

与英伟达A100相比，华为昇腾AI芯片在训练大模型的效率层面已经达到英伟达的1.1倍，尤其在训练Llama、BloomGPT等主流开源大模型时，昇腾AI算力训练效率已经优于英伟达A100，更是领先国内同行竞品10倍！

华为自2018年10月发布AI战略以来，稳步而有序地推进战略执行、产品研发及商用进程。昇腾910、MindSpore的推出，标志着华为已完成全栈全场景AI解决方案(Portfolio)的构建，也标志着华为AI战略的执行进入了新的阶段。

昇腾910算力芯片属于Ascend-max系列。在HC2018上已经发布了其技术规格。实际测试结果表明，在算力方面，昇腾910半精度 (FP16)算力达到256 Tera-FLOPS，整数精度 (INT8) 算力达到512 Tera-OPS，重要的是，达到规格算力所需功耗仅310W，明显低于设计规格的350W。徐直军表示：昇腾910总体技术表现超出预期，作为算力最强AI处理器，当之无愧。

王陶介绍称，在中国的国产大模型里面，有将近50%的客户选择昇腾技术路线。昇腾现在已经是国产大模型的第一选择。具有超强AI算力、更优AI能效、极佳AI拓展等特点，可广泛应用于深度学习模型开发和训练。

目前，国内头部的AI大模型当中，只有科大讯飞的星火大模型完全基于华为昇腾算力平台进行训练。

“经过测试，科大讯飞使用华为的万卡集群进行大模型训练可实现英伟达A100的0.8~1.2倍的效率。与后者整体性能相比的确还存在一定差距，但在大模型训练这一块，已经与英伟达主流产品没有明显差距，特别是在万卡算力集群实践上，鲲鹏与科大讯飞联手完成了市场检验。”王陶称。

换而言之，华为昇腾是目前国内科技企业难以直接采购英伟达算力GPU的最佳平替。

根据科大讯飞公布的消息，新一代的星火V4.0大模型将在6月27日下周发布，将提供多项GPT-4o不具备的能力。比如：一句话复刻音色、高噪音场景语音识别、中国方言多语种翻译功能等。

文章来源于互联网:勇夺第一！华为昇腾AI算力平台训练大模型效率超越英伟达A100

相关推荐: 1毛钱1百万token，写2遍红楼梦！国产大模型智谱AI下一步还想卷什么？

刚刚，智谱AI开放日上，新一代MaaS平台2.0正式发布。这次，GLM技术团队带来的是从模型，到成本、企业定制模型，以及业务场景的全面升级。令人惊喜的是，第四代GLM系列开源模型GLM-4 9B，官宣开源免费用，还具备了多模态能力。同时，新发布的GLM-4…

勇夺第一！华为昇腾AI算力平台训练大模型效率超越英伟达A100

相关推荐

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来