【保姆级教程】使用ollama在cpu上运行llamafactory训练后的大模型

文章目录 隐藏

一、前言

三、ollama 运行转换后的gguf模型文件

1.ubuntu22.04安装ollama

2. 创建 ModelFile 文件

3. 运行这个模型

4. 常用的ollama 命令

一、前言

本地运行条件有限，原本在GPU上训练运行正常的模型，转到CPU上就不可以运行了，所以就有了这篇文章。主要用的模型与技术有下：
大模型：Qwen/Qwen2.5-7B-Instruct
训练框架：llamafactory
转格式工具：llama.cpp
运行工具：ollama

二、处理 llamafactory 训练后的数据
训练完成后的文件存储至saves目录下，如图：

1.大模型合并

执行 llamafactory-cli export examples/merge_lora/qwen_lora_sft.yaml

执行完成后，会在model/qwen/  路径下生成合成的相关文件，如下图：

二、lama.cpp模型转换guff

1. 安装llama.cpp

下载文件：https://github.com/ggerganov/llama.cpp/blob/master/convert_hf_to_gguf.py

2. 模型转换

python3 convert_lora_to_gguf.py  /data/release/models/qwen_sft --outtype f16  --outfile

解释：
/data/release/models/qwen_sft 为合并之后的文件路径

/data/release/models/qwen_sft/qwen_sft.gguf 为转化后文件的路径和文件名

–outtype f16根据项目需求进行调整

三、ollama 运行转换后的gguf模型文件

1.ubuntu22.04安装ollama

ollama安装教程

2. 创建 ModelFile 文件

FROM ./my_model.gguf

TEMPLATE """{{ if .System }}|im_start|>system
{{ .System }}|im_end|>
{{ end }}{{ if .Prompt }}|im_start|>user
{{ .Prompt }}|im_end|>
{{ end }}|im_start|>assistant
"""
SYSTEM """
系统提示词，限制等
"""
PARAMETER stop [INST]
PARAMETER stop [/INST]
PARAMETER stop SYS>>
PARAMETER stop /SYS>>
PARAMETER temperature 0.7
PARAMETER top_p 0.9
PARAMETER top_k 20
PARAMETER repeat_penalty 1.05 
PARAMETER seed 10
PARAMETER num_ctx 4096

3. 运行这个模型

ModelFile 为上面创建的ModelFile文件，模型文件较大的话，运行会比较慢，稍等即可

ollama create my_model -f ModelFile

4. 常用的ollama 命令

启动Ollama服务‌： ollama serve
‌创建模型‌： ollama create /path/to/Modelfile
‌显示模型信息‌： ollama show model_name
‌列出所有模型‌： ollama list 或 ollama ls
‌运行模型‌： ollama run model_name
‌列出正在运行的模型‌： ollama ps
‌删除模型‌： ollama rm model_name
‌查看版本‌： ollama -v 或 ollama –version
‌复制模型‌： ollama cp old_model new_model
‌从注册表拉取模型‌： ollama pull model_name
‌将模型推送到注册表‌： ollama push model_name
‌获取有关Ollama任何命令的帮助信息‌： ollama help‌

文章来源于互联网:【保姆级教程】使用ollama在cpu上运行llamafactory训练后的大模型

相关推荐: AIGC从入门到实战：进行硬件部署和运行工程源码

AIGC, 硬件部署, 运行工程, 源码, 深度学习, 自然语言处理, 图像生成, 模型优化, 性能调优 1. 背景介绍近年来，人工智能（AI）技术取得了飞速发展，特别是生成式人工智能（AIGC）的兴起，为人们带来了前所未有的创作和体验。AIGC能够根据输入…

【保姆级教程】使用ollama在cpu上运行llamafactory训练后的大模型

一、前言

1.大模型合并

二、lama.cpp模型转换guff

1. 安装llama.cpp

2. 模型转换

三、ollama 运行转换后的gguf模型文件

1.ubuntu22.04安装ollama

2. 创建 ModelFile 文件

3. 运行这个模型

4. 常用的ollama 命令

相关推荐

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来