
【ASR技术】WhisperX安装&使用
介绍 WhisperX 是一个开源的自动语音识别(ASR)项目,由 m-bain 开发。该项目基于 OpenAI 的 Whisper 模型,通过引入批量推理、强制音素对齐和语音活动检测等技术。提供快速自动语音识别(large-v2 为 70...

介绍 WhisperX 是一个开源的自动语音识别(ASR)项目,由 m-bain 开发。该项目基于 OpenAI 的 Whisper 模型,通过引入批量推理、强制音素对齐和语音活动检测等技术。提供快速自动语音识别(large-v2 为 70...

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: AIGC | GPTs应用实例 关于GPTs指令如何在ChatGPT上使用,请看这篇文章: 【AIGC】如何在ChatGPT中制作个性化GPTs应用详解 https://blog.cs...

更多MJ教程: MJ 推出一款名为 “Patchwork” 的全新实验性多人世界构建工具。它结合了语言模型、图像模型和基于画布的界面来构建故事的基础。 这和 Figma 多人协作味道很像,同时我个人猜测它要抢 Comfy UI 生意。 一、...

前言 Task 01 通过预训练模型的调用,在baseline上跑通模型,实现内容→图片。即,根据prompt中输入的文本描述,模型生成对应的图片。Task 02 深入学习。 一、AI生图技术 1.1 基础点 AIGC(AI-Generat...

9月份解锁文章写作新招:100+顶级提示词,效率翻倍不是梦! 文心一言9月份官方秘籍,助力内容创作! 最近他给我们贴出了文心一言的官方😆写作润色提示词 对职场打工人或是正在做自媒体的达人很有实用价值🌈 马上拿来跟大家分享下~ 需要这份资料的...
入门教程提供了Stable Diffusion的基本使用方法。对于更高级的功能,如插件使用、模型部署等,可以在掌握基础操作后进一步学习。 一、Stable Diffusion教程 Stable Diffusion是一款基于人工智能技术开发的...

AnimateDiff是什么? AnimateDiff 是一个能够将个性化的文本转换为图像的扩展模型,它可以在无需特定调整的情况下实现动画效果。通过这个项目,用户可以将他们的想象力以高质量图像的形式展现出来,同时以合理的成本实现这一目标。随...

Checkpoint、Lora、Hypernetworks是 Stable Diffusion Web UI 生图的重要工具,它们有各自的特点,结合不同的生图场景选择一个或者多个叠加使用,能够更好的命令 Stable Diffusion 生...

介绍 时隔已久的 llama-factory 系列教程更新了。本篇文章是第七篇,之前的六篇,大家酌情选看即可。 因为llama-factory进行了更新,我前面几篇文章的实现部分,都不能直接用了。 我将为大家介绍如何使用 llama-fac...

前言 在之前的文章中我们介绍了Stable Diffusion的基础参数,我们知道使用Stable Diffusion UI基础的操作流程并不复杂,主要分为 4 个步骤:选择模型 —> 填写提示词 —> 设置参数 —> 点...