
LLM基础学习03:Qwen2.5-1.5B-Instruct指令微调全流程实践——LLaMA Factory框架与GSM8K评估
希望尽可能将自己学习过程中参考过的资料进行系统的整理,方便后面的初学者更快的找到自己想要的资料! 笔记持续更新中… LLM基础学习01:LLM解码策略和显存占用计算 LLM基础学习02:分布式训练核心架构与多级并行策略详解——DDP/FSD...

希望尽可能将自己学习过程中参考过的资料进行系统的整理,方便后面的初学者更快的找到自己想要的资料! 笔记持续更新中… LLM基础学习01:LLM解码策略和显存占用计算 LLM基础学习02:分布式训练核心架构与多级并行策略详解——DDP/FSD...

最近DeepSeek爆火,试用DeepSeek的企业和个人越来越多。最常见的应用场景就是知识库和知识问答。所以本人也试用了一下,在笔记本电脑上部署DeepSeek并使用开源工具搭建一套知识库,实现完全在本地环境下使用本地文档搭建个人知识库。...
公共资源速递 This Weekly Snapshots ! 5 个数据集: * Character Codex 人物角色数据集 * Magpie-Filtered 高质量对齐数据集 * OmniMedVQA 医学 VQA 评测数据集 * ...

首先讲一下环境 这是2024 年12月,llama.cpp 的编译需要cmake 呜呜呜 网上教程都是make 跑的。反正我现在装的时候make已经不再适用了,因为工具的版本,捣鼓了很久。 ubuntu 18 + conda env内置安装...
深入解读并实践:Llama.cpp 的安装与使用指南 在人工智能领域,Llama.cpp 是一个轻量级推理引擎,用于运行各种大型语言模型(LLMs)。本文将围绕 Python 绑定库 llama-cpp-python 展开,详细介绍如何安装...

自定义 LLM 自定义 LLM 需要实现以下必要的函数: _call :它需要接受一个字符串、可选的停用词,并返回一个字符串。 它还可以实现第二个可选的函数: _identifying_params :用于帮助打印 LLM 信息。该函数应该...

在今天的的教程中,我们将打造更加个性化的大模型,可以定制搭载私人知识库的本地大模型! 我们探讨Meta AI 的尖端 Llama 3 语言模型构建强大的检索增强生成 (RAG**) 来实现。通过利用 Llama 3 和 RAG 技术的功能,...
![[LLM+AIGC] 04.零基础DeepSeek接入WPS实现智能办公-5bei.cn大模型教程网](https://file.5bei.cn/2025/02/frc-f24a2fede8088b282a59f491c1278605-220x150.png)
近年来,人工智能技术火热发展,尤其随着ChatGPT和DeepSeek被提出,其能够基于在预训练阶段所见的模式、统计规律和知识来生成回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流以及完成复杂的NLP任务。基于此,为更好地学习前...

在日常开发和使用AI模型时,我们经常会遇到这些问题: • 每个AI平台都有独特的API,需要分别对接非常繁琐 • 不同模型的接口参数和返回格式不统一,增加了维护成本 • 在多个平台间切换模型时需要修改大量代码 • 难以统一管理各平台的API...

n8n AI Agent 是一个利用大型语言模型(LLMs)来设计和构建智能体(agents)的工具,这些智能体能够执行一系列复杂的任务,如理解指令、模仿类人推理,以及从用户命令中理解隐含意图。n8n AI Agent 的核心在于构建一系列...