AI大模型教程
一起来学习

Meta 发布 Llama 3.3:一个性能和效率均有所提升的多语言模型

Meta 发布 Llama 3.3:一个性能和效率均有所提升的多语言模型

Meta 发布了 Llama 3.3,这是一款多语言大语言模型,旨在支持研究和行业中的一系列人工智能应用。该模型具有 128k 个 token
上下文窗口,并对架构进行了改进以提高效率,在推理、编码和多语言任务的基准测试中表现出色。该模型在 Hugging Face 上以社区许可的形式提供。

Llama 3.3 对之前版本进行了改进,具有更长的上下文窗口,长达 128k 个 token,并使用分组查询注意力(Grouped-Query
Attention,GQA)优化了 Transformer
架构,以实现更好的可扩展性和效率。它通过将监督学习和基于人类反馈的强化学习相结合来进行微调,确保在各种任务中的出色表现,同时保持有用性和安全性。

该模型在关键基准测试中表现出色。这个拥有 700 亿个参数的模型在多语言对话、推理、编码和安全评估方面的表现优于开源和专有替代方案:

  • 推理和知识 :Llama 3.3 在具有挑战性的 GPQA 推理基准上,准确率达到了 50.5%,与其前身相比,有所改进。

  • 代码生成 :该模型在 HumanEval 编码基准上,

文章来源于互联网:Meta 发布 Llama 3.3:一个性能和效率均有所提升的多语言模型

相关推荐: 大厂实战!百度「捏合总结」功能设计复盘

前言 随着 AI 技术的不断进步,用户对于信息获取的即时性、准确性及个性化程度均提出了更高的期望,而对于设计师的挑战则是如何利用设计思维和 AI 技术,帮助用户更高效地获取信息,同时打造出具有智能感知的新功能。 本文将结合百度 APP 近期上线的「捏合总结」功…

赞(0)
未经允许不得转载:5bei.cn大模型教程网 » Meta 发布 Llama 3.3:一个性能和效率均有所提升的多语言模型
分享到: 更多 (0)

AI大模型,我们的未来

小欢软考联系我们