
一文彻底搞懂大模型 - LLaMA-Factory
LLaMA-Factory 如何高效地微调和部署大型语言模型(LLM)? LLaMA-Factory作为一个开源的微调框架,应运而生,为开发者提供了一个简便、高效的工具,以便在现有的预训练模型基础上,快速适应特定任务需求,提升模型表现。LL...

LLaMA-Factory 如何高效地微调和部署大型语言模型(LLM)? LLaMA-Factory作为一个开源的微调框架,应运而生,为开发者提供了一个简便、高效的工具,以便在现有的预训练模型基础上,快速适应特定任务需求,提升模型表现。LL...

✨ 1: LLaMA-Omni LLaMA-Omni是基于Llama-3.1-8B-Instruct构建的语音语言模型,支持高质量低延迟的语音互动。 LLaMA-Omni是一个基于Llama-3.1-8B-Instruct构建的语音语言模型...

本机配置 品牌:联想拯救者Y9000x-2022 CPU:12th Gen Intel® Core™ i7-12700H 2.30 GHz RAM:24.0 GB (23.8 GB 可用) GPU: NVIDIA GeForce RTX 3...

技术的车轮滚滚向前,但用户的需求却相对稳定。不管是初创公司还是大厂,如果在新技术范式吹起来的这股风停下来之前,没能及时找到有希望的落地方向(能满足用户真实需求+有市场机会),风一停,就会跌落进泥土里,消失在空中;而如果落地应用难做起来的话,...

大模型相关目录 大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容从0起步,扬帆起航。 swift与Internvl下的多模态大模型分布式微调指南(附代码和数...

本地化LLM应用:Local_Llama——离线文档聊天的未来 local_llama This repo is to showcase how you can run a model locally and offline, free o...
项目背景与概述 LLaMA-Factory项目目标 LLaMA-Factory项目是一个专注于大模型训练、微调、推理和部署的开源平台。其主要目标是提供一个全面且高效的解决方案,帮助研究人员和开发者快速实现大模型的定制化需求。具体来说,LLa...

介绍 随着ChatGPT的横空出世,国内互联网大厂、创业公司纷纷加了AIGC赛道,不断推出各种大模型,而这些大模型由于规模庞大、结构复杂,往往包含了数十亿至数千亿的参数。这些模型在训练阶段,一般需要使用高效能的GPU集群训练数十天时间,在推...

分享下自己改进的一个lora训练脚本,在ubuntu下如果SD-WEBUI的环境已经搭好的话,只需要下载lora-script就可以支持训练了,直接命令行方式训练。 首先,我们需要克隆下项目: git clone https://githu...

环境搭建 系统环境 需要Nvidia显卡,至少8G显存,且专用显存与共享显存之和大于20G 建议将非安装版的环境文件都放到非系统盘,方便重装或移植 以Windows11为例,非安装环境文件都放在 E 盘下 设置自定义Path文件夹 创建 E...