AI大模型教程
一起来学习

标签:LLM

第50页
DeepSeek 发布全新开源大模型,数学推理能力超越 LLaMA-2-5bei.cn大模型教程网
AI创作

DeepSeek 发布全新开源大模型,数学推理能力超越 LLaMA-2

LunarEclipse阅读(531)赞(0)

自从 LLaMA 被提出以来,开源大型语言模型(LLM)的快速发展就引起了广泛研究关注,随后的一些研究就主要集中于训练固定大小和高质量的模型,但这往往忽略了对 LLM 缩放规律的深入探索。 开源 LLM 的缩放研究可以促使 LLM 提高性能...

llama-factory微调工具使用入门-5bei.cn大模型教程网
AI创作

llama-factory微调工具使用入门

LunarEclipse阅读(527)赞(0)

一、定义 环境配置 案例: https://zhuanlan.zhihu.com/p/695287607 chatglm3 案例 多卡训练deepspeed llama factory 案例Qwen1.5 报错 二、实现 环境配置 git ...

结构篇| 浅析LLaMA网络架构-5bei.cn大模型教程网
AI创作

结构篇| 浅析LLaMA网络架构

FrozenEmbers阅读(885)赞(0)

结构篇| 浅析LLaMA网络架构 原创 程序猿阿三 程序猿阿三 2024年12月04日 22:22 福建 点击蓝字 关注我们 不迷路 01 前言 LLaMA(Large Language Model Meta AI)是由Meta AI 发布...

大模型干货 | 如何使用Unsloth框架对Llama进行微调?-5bei.cn大模型教程网
AI创作

大模型干货 | 如何使用Unsloth框架对Llama进行微调?

EnigmaticGaze阅读(1790)赞(0)

本文来源于布博士—-擎创科技产品解决方案专家 今年4月份,Meta 公司发布了功能强大的大型语言模型(LLM)Llama-3,为从事各种 NLP 任务的开发人员提供了功能强大可以在普通机器上运行的开源LLM。然而,传统的 LLM...

大模型

文心一言、讯飞星火、GPT、通义千问等线上API调用示例

AuroraBorealis阅读(455)赞(0)

大模型相关目录 大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容从0起步,扬帆起航。 大模型应用向开发路径及一点个人思考 大模型应用开发实用开源项目汇总 大...

AI大模型,我们的未来

小欢软考联系我们