标签：LLM

第79页

LLama-Factory大模型训练框架，基于自己数据集微调qwen7B模型实战

2024-09-14EmberGlimmer阅读(637)赞(0)

一，项目简介 LLama-Factory，大模型训练框架，支持多种模型，多种训练方式，项目github地址：link 项目特色多种模型：LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baic...

AI创作

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡（五）

2024-09-12ai_helper阅读(19)赞(0)

一、前言本篇文章将使用LLaMA-Factory去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。二、术语介绍 2.1. LoRA微调 LoRA (...

AI创作

测试：ollama加载羊驼版本llama-3中文大模型

2024-09-12FrozenEmbers阅读(422)赞(0)

找了一个晚上各种模型，像极了当初找各种操作系统的镜像，雨林木风，深蓝、老毛桃…… 主要是官方的默认7B版本回答好多英文，而且回复的很慢，所以我是在ollama上搜索”chinese”找到了这个羊驼版本的， ollam...

AI创作

【尘缘送书第六期】2023年度学习：AIGC、AGI、GhatGPT、人工智能大模型实现必读书单

2024-09-11FrozenEmbers阅读(298)赞(0)

【文末送书】今天推荐几本AIGC、AGI、GhatGPT、人工智能大模型领域优质书籍。前言 2023年是人工智能大语言模型大爆发的一年，一些概念和英文缩写也在这一年里集中出现，很容易混淆，甚至把人搞懵。 **LLM：**Large Lan...

大模型

【大模型能力分水岭数学考试，文心一言超gpt4o排名第一】

2024-09-11CosmicWanderer阅读(489)赞(0)

文末有福利！ 2024年全国高考成绩陆续放榜，各位考生的成绩怎么样？在本次考试中还有几位特殊的考生——国内外知名的9个AI大模型也“参与”了本次高考，它们的成绩可谓也是“几家欢喜，几家愁”。以河北省录取分数线（文科一本线：521分，理科一...

AI创作

开源模型应用落地-Meta-Llama-3.1-8B-Instruct与vllm-单机多卡-RTX 4090双卡（十四）

2024-09-11EnchantedScribe阅读(1105)赞(0)

一、前言在应对业务访问量级提升的过程中，我们通过从单机单卡部署升级到单机多卡部署的方式，成功实现了VLLM模型的性能提升。在此过程中,我们遇到了一些问题和挑战，现在我将深入剖析这些经验教训，希望能够帮助大家快速上手部署可投入生产运...

AI创作

使用diffusers来训练自己的Stable Diffusion 3大模型

2024-09-10CrimsonFeather阅读(947)赞(0)

基于diffusers的Stable diffusion训练代码这里给大家介绍一个基于diffusers库来训练stable diffusion相关模型的训练代码，包含Lora、ControlNet、IP-adapter、Animated...

AI创作

2024-03-26 AIGC-大模型学习路线

2024-09-06FrozenEmbers阅读(553)赞(0)

摘要: 2024-03-26 AIGC-大模型学习路线大模型学习路线建议先从主流的Llama开始，然后选用中文的Qwen/Baichuan/ChatGLM，先快速上手体验prompt工程，然后再学习其架构，跑微调脚本如果要深入学习，建...

AI创作

字节携港大南大升级 LLaVA-NeXT：借 LLaMA-3 和 Qwen-1.5 脱胎换骨，轻松追平 GPT-4V

2024-09-04EmberGlimmer阅读(657)赞(0)

文 | 王启隆出品 | 《新程序员》编辑部 2023 年，威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员共同开发的 LLaVA 首次亮相，彼时它被视为一个端到端训练的大型多模态模型，展现了在视觉与语言融合领域的潜力。今年 1 ...

AI创作

【LLM第二篇】stable diffusion扩散模型、名词解释

2024-09-02LunarFrost阅读(1053)赞(0)

最近在整理大模型的相关资料，发现了几个名词，不是很懂，这里整理一下： stable diffusion（SD)模型：扩散模型（Diffusion model）的一种，主要用于生成高质量的图像，GAN的替代者，扩散模型通过一些列学习步骤生成...

上一页
1
···
76
77
78
79
80
81
82
...
下一页
共 106 页

标签：LLM

LLama-Factory大模型训练框架，基于自己数据集微调qwen7B模型实战

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡（五）

测试：ollama加载羊驼版本llama-3中文大模型

【尘缘送书第六期】2023年度学习：AIGC、AGI、GhatGPT、人工智能大模型实现必读书单

【大模型能力分水岭数学考试，文心一言超gpt4o排名第一】

开源模型应用落地-Meta-Llama-3.1-8B-Instruct与vllm-单机多卡-RTX 4090双卡（十四）

使用diffusers来训练自己的Stable Diffusion 3大模型

2024-03-26 AIGC-大模型学习路线

字节携港大南大升级 LLaVA-NeXT：借 LLaMA-3 和 Qwen-1.5 脱胎换骨，轻松追平 GPT-4V

【LLM第二篇】stable diffusion扩散模型、名词解释

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来