标签：LLM

第50页

DeepSeek 发布全新开源大模型，数学推理能力超越 LLaMA-2

2025-03-11LunarEclipse阅读(531)赞(0)

自从 LLaMA 被提出以来，开源大型语言模型（LLM）的快速发展就引起了广泛研究关注，随后的一些研究就主要集中于训练固定大小和高质量的模型，但这往往忽略了对 LLM 缩放规律的深入探索。开源 LLM 的缩放研究可以促使 LLM 提高性能...

AI创作

llama-factory微调工具使用入门

2025-03-11LunarEclipse阅读(527)赞(0)

一、定义环境配置案例： https://zhuanlan.zhihu.com/p/695287607 chatglm3 案例多卡训练deepspeed llama factory 案例Qwen1.5 报错二、实现环境配置 git ...

AI创作

结构篇| 浅析LLaMA网络架构

2025-03-11FrozenEmbers阅读(885)赞(0)

结构篇| 浅析LLaMA网络架构原创程序猿阿三程序猿阿三 2024年12月04日 22:22 福建点击蓝字关注我们不迷路 01 前言 LLaMA（Large Language Model Meta AI）是由Meta AI 发布...

AI创作

DCA，不需训练让Llama上下文扩大48倍的方法

2025-03-11EmberHeart阅读(466)赞(0)

论文标题：Training-Free Long-Context Scaling of Large Language Models 论文地址：https://arxiv.org/pdf/2402.17463 最近研究Qwen2和Qwen2.5...

AI创作

在个人 Linux 机器 (GPU/CPU) 上本地运行 LLaMA-3(Docker+Ollama+Open WebUI+LLama3教程含详细步骤)

2025-03-10EmberGlimmer阅读(448)赞(0)

在当今快速发展的人工智能环境中，部署开源大型语言模型 (LLM) 通常需要复杂的计算基础设施。然而，Ollama 的创新平台正在改变这一规范，支持在标准个人计算机上使用这些强大的模型，支持CPU和GPU配置。本指南介绍了如何使用 Ollam...

AI创作

大模型干货 | 如何使用Unsloth框架对Llama进行微调？

2025-03-09EnigmaticGaze阅读(1790)赞(0)

本文来源于布博士—-擎创科技产品解决方案专家今年4月份，Meta 公司发布了功能强大的大型语言模型（LLM）Llama-3，为从事各种 NLP 任务的开发人员提供了功能强大可以在普通机器上运行的开源LLM。然而，传统的 LLM...

AI创作

开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B-LoRA微调-LLaMA-Factory-单机单卡-V100（一）

2025-03-09FrozenEmbers阅读(8)赞(0)

一、前言如今，大语言模型领域热闹非凡，各种模型不断涌现。DeepSeek-R1-Distill-Qwen-7B 模型凭借其出色的效果和性能，吸引了众多开发者的目光。而 LLaMa-Factory 作为强大的微调工具，能让模型更好地...

AI创作

LLaMa-Factory部署及llamafactory-cli webui命令无法打开ui界面问题解决记录

2025-03-09LunarEclipse阅读(2105)赞(0)

最近想学习一下大模型微调，记录一下llama-factory的部署过程及遇到的一些问题。 LLaMa-Factory官方地址：hiyouga/LLaMA-Factory: Unified Efficient Fine-Tuning of 1...

AI创作

从加载到对话：使用 Llama-cpp-python 本地运行量化 LLM 大模型（GGUF）

2025-03-09EternalWish阅读(617)赞(0)

（无需显卡）使用 Llama-cpp-python 在本地加载具有 70 亿参数的 LLM 大语言模型，通过这篇文章你将学会用代码创建属于自己的 GPT。建议阅读完 19a 的「前言」和「模型下载」部分后再进行本文的阅读。代码文件下载：...

大模型

文心一言、讯飞星火、GPT、通义千问等线上API调用示例

2025-03-08AuroraBorealis阅读(455)赞(0)

大模型相关目录大模型，包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容从0起步，扬帆起航。大模型应用向开发路径及一点个人思考大模型应用开发实用开源项目汇总大...

上一页
1
···
47
48
49
50
51
52
53
...
下一页
共 106 页

标签：LLM

DeepSeek 发布全新开源大模型，数学推理能力超越 LLaMA-2

llama-factory微调工具使用入门

结构篇| 浅析LLaMA网络架构

DCA，不需训练让Llama上下文扩大48倍的方法

在个人 Linux 机器 (GPU/CPU) 上本地运行 LLaMA-3(Docker+Ollama+Open WebUI+LLama3教程含详细步骤)

大模型干货 | 如何使用Unsloth框架对Llama进行微调？

开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B-LoRA微调-LLaMA-Factory-单机单卡-V100（一）

LLaMa-Factory部署及llamafactory-cli webui命令无法打开ui界面问题解决记录

从加载到对话：使用 Llama-cpp-python 本地运行量化 LLM 大模型（GGUF）

文心一言、讯飞星火、GPT、通义千问等线上API调用示例

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来