标签：LLM

第69页

突破模型训练瓶颈：LLaMA-Factory 使用指南

2024-12-31LunarEclipse阅读(3271)赞(0)

LLaMA-Factory 简介 LLaMA-Factory 是一个强大的深度学习模型训练和微调平台，支持多种先进的语言模型，如 LLaMA、LLaVA、Mistral、ChatGLM 等。该工具不仅支持传统的语言模型训练，还集成了多种前沿...

AI创作

新型大语言模型的预训练与后训练范式，Meta的Llama 3.1语言模型

2024-12-31EnchantedScribe阅读(646)赞(0)

前言：大型语言模型（LLMs）的发展历程可以说是非常长，从早期的GPT模型一路走到了今天这些复杂的、公开权重的大型语言模型。最初，LLM的训练过程只关注预训练，但后来逐步扩展到了包括预训练和后训练在内的完整流程。后训练通常涵盖监督指导微调和...

AI创作

LLM评估 | 大模型评估方法调研--论文解读（持续更新ing）

2024-12-31EmberGlimmer阅读(1342)赞(0)

引言本文调研了一些大语言模型用于评估的综述和学术论文，详细解读并提取了值得参考的关键内容，希望能帮助到需要使用大模型代替人类进行数据集评测的研究人员和从业者 LLM-based NLG Evaluation: Current Status...

AI创作

llama-factory SFT系列教程 (二)，大模型在自定义数据集 lora 训练与部署

2024-12-30EternalWish阅读(1365)赞(0)

简介文章列表： llama-factory SFT系列教程 (一)，大模型 API 部署与使用 llama-factory SFT系列教程 (二)，大模型在自定义数据集 lora 训练与部署 llama-factory SFT系列教程 (...

AI创作

【AIGC安全】CCF-CV企业交流会直播回顾：探寻AI安全治理，共筑可信AI未来

2024-12-30ai_helper阅读(301)赞(0)

一、活动背景：AI技术快速发展与安全治理需求迫切随着人工智能（AI）技术的迅猛进步，尤其是以ChatGPT为代表的大型语言模型技术的兴起，AI技术已广泛渗透至各个领域。然而，AI技术的快速发展亦伴随着一系列安全隐患的出现，如数据安全、知识...

AI创作

【AIGC】LangChain 环境搭建及模型API能力集成使用详解

2024-12-30EmberGlimmer阅读(673)赞(0)

目录一、前言二、LangChain 概述 2.1 LangChain 是什么 2.2 LangChain 主要特点 2.3 LangChain能做什么和能力一览 2.4 LangChain 主要应用场景三、环境准备 3.1 pytho...

AI创作

Llama 3模型：多维度损失函数铸就大语言模型新巅峰

2024-12-29ai_helper阅读(572)赞(0)

在人工智能领域,大型语言模型(Large Language Models, LLMs)的发展如火如荼。作为这一领域的佼佼者,Llama系列模型一直备受关注。随着Llama 3的横空出世,其在模型架构、训练方法等方面的创新再次引发业界热议。本...

AI创作

LLM - 使用 LLaMA-Factory 微调 Qwen2-VL DPO(LoRA) 图像数据集教程 (3)

2024-12-29EnigmaticGaze阅读(936)赞(0)

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/144068871 免责声明：本文来源于个人知识与公开资料，仅...

AI创作

检索生成(RAG) vs 长文本大模型：实际应用中如何选择？

2024-12-28EmberGlimmer阅读(626)赞(0)

编者按：大模型的上下文理解能力直接影响到 LLMs 在复杂任务和长对话中的表现。本期内容聚焦于两种主流技术：长上下文(Large Context Windows)和检索增强生成(RAG)。这两种技术各有何优势？在实际应用中，我们又该如何权衡...

AI创作

五个优秀的免费 Ollama WebUI 客户端推荐

2024-12-27ai_helper阅读(2580)赞(0)

认识 Ollama 本地模型框架，并简单了解它的优势和不足，以及推荐了 5 款开源免费的 Ollama WebUI 客户端，以提高使用体验。什么是 Ollama？ Ollama 是一款强大的本地运行大型语言模型（LLM）的框架，它允许用户...

上一页
1
···
66
67
68
69
70
71
72
...
下一页
共 106 页

标签：LLM

突破模型训练瓶颈：LLaMA-Factory 使用指南

新型大语言模型的预训练与后训练范式，Meta的Llama 3.1语言模型

LLM评估 | 大模型评估方法调研--论文解读（持续更新ing）

llama-factory SFT系列教程 (二)，大模型在自定义数据集 lora 训练与部署

【AIGC安全】CCF-CV企业交流会直播回顾：探寻AI安全治理，共筑可信AI未来

【AIGC】LangChain 环境搭建及模型API能力集成使用详解

Llama 3模型：多维度损失函数铸就大语言模型新巅峰

LLM - 使用 LLaMA-Factory 微调 Qwen2-VL DPO(LoRA) 图像数据集教程 (3)

检索生成(RAG) vs 长文本大模型：实际应用中如何选择？

五个优秀的免费 Ollama WebUI 客户端推荐

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来