标签：总结

第247页

FireAct：推进语言智能体的微调 [译]

2024-07-28AstralSeeker阅读(570)赞(0)

剑桥大学、莫纳什大学和普林斯顿大学共同研究。代码、数据和模型可以在 https://fireact-agent.github.io 查看。摘要近期研究将语言模型与外部工具或环境结合起来，发展出能够进行推理和行动的“语言智能体”。尽管如此...

AI创作

使用LlamaFactory进行模型微调：参数详解

2024-07-28EnchantedScribe阅读(3505)赞(0)

在深度学习和自然语言处理领域，模型微调是提升预训练模型性能的重要手段。本文将介绍如何使用LlamaFactory进行模型微调，并详细解析一些关键参数，包括 --cutoff_len 1024、--flash_attn auto、--lora...

AI创作

Whisper-AT：抗噪语音识别模型（Whisper）实现通用音频事件标记（Audio Tagger）

2024-07-28FrozenEmbers阅读(773)赞(0)

本文介绍一个统一音频标记（Audio Tagger）和语音识别（ASR）的模型：Whisper-AT，通过冻结Whisper的主干，并在其之上训练一个轻量级的音频标记模型。Whisper-AT在额外计算成本不到1%的情况下，可...

AI创作

AIGC案例实战！百度APP 如何用 AI 完成242个彩蛋设计？

2024-07-28h_openai阅读(528)赞(0)

导语得益于 AI 技术的有力支撑，百度 APP 塑造出独特的互动彩蛋体验模式，大幅提升了用户参与度与社区凝聚力。早在 2023 年端午节时，我们对彩蛋初次探索即获好评，故将其作为长效运营手段，决定全年运营，筹划借助 AI 提效互动彩蛋生产...

机器学习

多模态和多模态大模型 (LMM)[译]

2024-07-27WhisperingWillow阅读(1217)赞(0)

以前，我们的机器学习模型一般都只处理一种类型的数据，比如只处理文本（翻译、语言建模）、图像（对象检测、图像分类）或音频（语音识别）。但是，想想我们人类的大脑。我们不仅仅读写文字，还可以看图、看视频，听音乐，还能够辨识各种不同的声音。所以，...

AI创作

我奶都能看懂的Controlnet简明教程（AI绘画Stable Diffusion最强插件）

2024-07-27ElectricStorm阅读(225)赞(0)

大家好，我是程序员晓晓 Ai绘画目前可控性不强是一个共识，绝大部分工具甚至连人物姿势都无法控制，所以每次绘画都是一次开盲盒过程，在这种情况下，很难应用到实际工作中去，很多时候几乎就是一个玩具。 Controlnet的出现，改变了这种局面。它...

AI创作

ComfyUI 进阶篇！完整梳理 ComfyUI 的核心节点（二）

2024-07-27ai_helper阅读(5)赞(0)

前言：学习 ComfyUI 是一场持久战。当你掌握了 ComfyUI 的安装和运行之后，会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类，可能会让人感到不知所措。在这篇文章中，我们将用通俗易懂的语言对 ComfyUI 的核心...

AI创作

语音识别神器 Whisper 的几个小技巧

2024-07-27LunarEclipse阅读(499)赞(0)

1、前言 OpenAI开源的免费离线语音识别神器Whisper，我在安装使用后发现一些问题，于是搜了半天最终汇总了这几个主要的小技巧，希望对大家有帮助，不用满世界再搜了。我主要用于中文的识别，所以就只说中文相关的了，我的环境是：系统：U...

AI资讯

OpenAI大杀器SearchGPT横空出世，将单挑谷歌千亿美元搜索帝国！

2024-07-26EmberHeart阅读(382)赞(0)

OpenAI，忽然深夜放大招了—— 今天半夜，OpenAI宣布推出名为Search GPT的AI搜索引擎，正式狙击搜索霸主谷歌。据《金融时报》称，OpenAI已准备好攻进谷歌1750亿美元的搜索业务市场。奥特曼在X上官宣此消息，大胆直言...

AI资讯

30s生成视频，免费不限次数，中国版OpenAI今天发布的「智谱清影」被玩疯了丨附体验指南

2024-07-26EmberGlimmer阅读(959)赞(0)

过去半年，国内外视频生成模型迎来了新一轮技术大爆发，也都总能在第一时间烧遍社交网络。与以往的「掉队」有所不同，近期趋势却显示国内在视频生成模型这一领域的进步大为超越了国际水平。不少国外网友表示，「中国的可灵 AI 视频」在引爆互联网，而 ...

上一页
1
···
244
245
246
247
248
249
250
...
下一页
共 280 页

标签：总结

FireAct：推进语言智能体的微调 [译]

使用LlamaFactory进行模型微调：参数详解

Whisper-AT：抗噪语音识别模型（Whisper）实现通用音频事件标记（Audio Tagger）

AIGC案例实战！百度APP 如何用 AI 完成242个彩蛋设计？

多模态和多模态大模型 (LMM)[译]

我奶都能看懂的Controlnet简明教程（AI绘画Stable Diffusion最强插件）

ComfyUI 进阶篇！完整梳理 ComfyUI 的核心节点（二）

语音识别神器 Whisper 的几个小技巧

OpenAI大杀器SearchGPT横空出世，将单挑谷歌千亿美元搜索帝国！

30s生成视频，免费不限次数，中国版OpenAI今天发布的「智谱清影」被玩疯了丨附体验指南

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来