AI创作

如何本地搭建Whisper语音识别模型

2024-12-17EmberHeart阅读(163)赞(0)

如何本地搭建Whisper语音识别模型 1. 引言 Whisper模型简介 Whisper是由OpenAI开发的一款先进的语音识别模型，它不仅能够将语音转换为文本，还能够识别和翻译多种语言。Whisper模型在大量不同音频数据集上进行训练，...

2024-12-16EnchantedScribe阅读(990)赞(0)

主要目的是复盘一下自己的第一个本地部署的代码。起因是老师布置的任务，想实现一个有关于教育场景的进行语音转录的模型。任务交给了本小白……好吧硬着头皮上，这篇博客也主要是记录自己的遇见的各种问题，以及对一些代码的改进。需...

2024-12-16CrimsonFeather阅读(315)赞(0)

节前，我们组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。汇总合...

2024-12-16h_openai阅读(1298)赞(0)

一、完整工作流拆解，一张图看懂最终会生成的内容：4 张图片（1 张封面页，3 张内容页），如下图：我们要实现上图工作流，需要先搭建「2 个图像流，1 个工作流，1 个卡片，1 个 Bot」，如下所示：二、图像流创建：封面页通过搭建「...

2024-12-16EternalWish阅读(63)赞(0)

一、AIGC时代的算法与模型训练概览 AIGC技术的核心在于其强大的内容生成能力，这背后离不开高效、精准的算法与模型训练。算法是指导模型学习的规则，而模型则是算法的具体实现。在AIGC时代，算法与模型训练不仅需要解决生成质量、泛化能力等问题...

2024-12-16EmberGlimmer阅读(351)赞(0)

问题及解决收录启动Stable Diffusion时候出现的各种问题及解决方案问题1：Failed to initialize: Bad git executable. 当点击项目目录下的webui.bat，会出现以下错误的时候：解决...

2024-12-16EnchantedScribe阅读(2939)赞(0)

💡 大家好，我是可夫小子，《小白玩转ChatGPT》专栏作者，关注AIGC、互联网和自媒体。 FunASR是什么？ FunASR 是一个基本的语音识别工具包，提供多种功能，包括语音识别 (ASR)、语音活动检测 (VAD)、标点符号恢复、语...

2024-12-16EmberHeart阅读(522)赞(0)

本文介绍在autodl.com搭建gpu服务器，实现stable-diffusion-webui+sadTalker功能，图片+音频可生成视频。 autodl租GPU 自己本地部署SD环境会遇到各种问题，网...

2024-12-16EternalWish阅读(0)赞(0)

博客主页： [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: AI绘画 | Midjourney 💯前言在设计领域中，色相作为色彩的重要维度，直接决定了作品的视觉基调与情感表达。通过对色相的深入理解与灵活运用，设计师可以在作品中精准传递信息，激发观众的...

2024-12-16CrimsonFeather阅读(2708)赞(0)

前言：很多人对ai 换脸换装都比较感兴趣，今天就记录一下目前主流的换脸方法！！一、Roop插件 1.安装方法 roop安装及失败解决教程，你还没玩sd的换脸吗？_哔哩哔哩_bilibili 借用b站一个博主的视频教程，简单快捷方便 ...