
【ASR技术】WhisperX安装&使用
介绍 WhisperX 是一个开源的自动语音识别(ASR)项目,由 m-bain 开发。该项目基于 OpenAI 的 Whisper 模型,通过引入批量推理、强制音素对齐和语音活动检测等技术。提供快速自动语音识别(large-v2 为 70...

介绍 WhisperX 是一个开源的自动语音识别(ASR)项目,由 m-bain 开发。该项目基于 OpenAI 的 Whisper 模型,通过引入批量推理、强制音素对齐和语音活动检测等技术。提供快速自动语音识别(large-v2 为 70...

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: AIGC | GPTs应用实例 关于GPTs指令如何在ChatGPT上使用,请看这篇文章: 【AIGC】如何在ChatGPT中制作个性化GPTs应用详解 https://blog.cs...

介绍 时隔已久的 llama-factory 系列教程更新了。本篇文章是第七篇,之前的六篇,大家酌情选看即可。 因为llama-factory进行了更新,我前面几篇文章的实现部分,都不能直接用了。 我将为大家介绍如何使用 llama-fac...

前言 在之前的文章中我们介绍了Stable Diffusion的基础参数,我们知道使用Stable Diffusion UI基础的操作流程并不复杂,主要分为 4 个步骤:选择模型 —> 填写提示词 —> 设置参数 —> 点...

在 Windows 11 上启用自带的基于 GPT-4 的 Copilot 功能。以下是具体步骤: 更新系统: 确保你的 Windows 11 系统已经更新到最新版本(23H2 或更高版本)。你可以在“设置” > “Windows 更...

GitHub Copilot申请和使用 前言 之前已经成功进行了Github学生认证,今天邮件通知之前的学生认证已经通过。那么就去进行GitHub Copilot申请和使用。 前面准备:Github学生认证 一、申请 进入github的se...

今天,我们将探索一个为Bilibili社区核心贡献者秋叶大佬所发布的神器——一款整合软件包。这款软件巧妙地简化了学习Python和网络知识这一通常漫长的过程。即使是编程新手,也能轻松入门并开始使用StableDiffusion(简称SD),...

▌导读 2024年10月22日,Stability AI团队发布Stable Diffusion 3.5,该模型可免费用于商业或非商业用途。 本文是了解Stable Diffusion 3.5的学习笔记,供有需求的同学一起学习参考。 ▌《S...

AIGC 实践全攻略:开启你的智能创作之旅! 随着人工智能生成内容(AI-Generated Content, AIGC)技术的迅速发展,我们正迎来一个全新的创作时代。无论是写作、绘画,还是视频剪辑,AIGC 都正在改变内容创作者的工作方式...
前言 随着人工智能技术的快速发展,大语言模型(LLM)已经成为了技术领域最热门的话题。本文将详细对比目前主流的大语言模型,帮助大家选择最适合的工具。 一、OpenAI GPT系列 1. GPT-4 核心优势: 多模态理解能力强 逻辑推理能力...