AI大模型教程
一起来学习

勇夺第一!华为昇腾AI算力平台训练大模型效率超越英伟达A100

AI-5bei网6月18日报道丨罕见公布!华为高管对外透露昇腾AI算力平台的性能。

在上周6月5日,2024世界半导体大会暨南京国际半导体博览会上,华为旗下的江苏鲲鹏·昇腾生态创新中心COO王陶透露,基于Ascend算力芯片打造的昇腾算力集群,是国内目前唯一可支持训练千亿参数大模型的解决方案,其AI算力性能已经超过了市面主流使用的英伟达A100。

英伟达A100被认为是当今AI大模型的“摇篮”,是海内外90%以上的大模型首选的训练平台。

与英伟达A100相比,华为昇腾AI芯片在训练大模型的效率层面已经达到英伟达的1.1倍,尤其在训练Llama、BloomGPT等主流开源大模型时,昇腾AI算力训练效率已经优于英伟达A100,更是领先国内同行竞品10倍!

华为自2018年10月发布AI战略以来,稳步而有序地推进战略执行、产品研发及商用进程。昇腾910、MindSpore的推出,标志着华为已完成全栈全场景AI解决方案(Portfolio)的构建,也标志着华为AI战略的执行进入了新的阶段。

昇腾910算力芯片属于Ascend-max系列。在HC2018上已经发布了其技术规格。实际测试结果表明,在算力方面,昇腾910半精度 (FP16)算力达到256 Tera-FLOPS,整数精度 (INT8) 算力达到512 Tera-OPS,重要的是,达到规格算力所需功耗仅310W,明显低于设计规格的350W。徐直军表示:昇腾910总体技术表现超出预期,作为算力最强AI处理器,当之无愧。

王陶介绍称,在中国的国产大模型里面,有将近50%的客户选择昇腾技术路线。昇腾现在已经是国产大模型的第一选择。具有超强AI算力、更优AI能效、极佳AI拓展等特点,可广泛应用于深度学习模型开发和训练。

目前,国内头部的AI大模型当中,只有科大讯飞的星火大模型完全基于华为昇腾算力平台进行训练。

“经过测试,科大讯飞使用华为的万卡集群进行大模型训练可实现英伟达A100的0.8~1.2倍的效率。与后者整体性能相比的确还存在一定差距,但在大模型训练这一块,已经与英伟达主流产品没有明显差距,特别是在万卡算力集群实践上,鲲鹏与科大讯飞联手完成了市场检验。”王陶称。

换而言之,华为昇腾是目前国内科技企业难以直接采购英伟达算力GPU的最佳平替。

根据科大讯飞公布的消息,新一代的星火V4.0大模型将在6月27日下周发布,将提供多项GPT-4o不具备的能力。比如:一句话复刻音色、高噪音场景语音识别、中国方言多语种翻译功能等。

文章来源于互联网:勇夺第一!华为昇腾AI算力平台训练大模型效率超越英伟达A100

相关推荐: 1毛钱1百万token,写2遍红楼梦!国产大模型智谱AI下一步还想卷什么?

刚刚,智谱AI开放日上,新一代MaaS平台2.0正式发布。 这次,GLM技术团队带来的是从模型,到成本、企业定制模型,以及业务场景的全面升级。 令人惊喜的是,第四代GLM系列开源模型GLM-4 9B,官宣开源免费用,还具备了多模态能力。同时,新发布的GLM-4…

赞(0)
未经允许不得转载:5bei.cn大模型教程网 » 勇夺第一!华为昇腾AI算力平台训练大模型效率超越英伟达A100
分享到: 更多 (0)

AI大模型,我们的未来

小欢软考联系我们