
记录本地部署 Whisper 模型的过程
Whisper 是论文中提出的用于自动语音识别 (ASR) 和语音翻译先进的模型通过大规模弱监督实现稳健语音识别 作者:Alec Radford 等人,来自 OpenAI。Whisper 在 >5M 小时的标记数据上进行了...

Whisper 是论文中提出的用于自动语音识别 (ASR) 和语音翻译先进的模型通过大规模弱监督实现稳健语音识别 作者:Alec Radford 等人,来自 OpenAI。Whisper 在 >5M 小时的标记数据上进行了...

Llama-GitHub 项目教程 llama-github Llama-github is an open-source Python library that empowers LLM Chatbots, AI Agents, and ...
本文是对stabled-diffusion的pipeline文件的代码逐行解释。 60-71行 该函数对经过cfg重组出来的noise_pred,再重组。 def rescale_noise_cfg(noise_cfg, noise_pre...

🎀🎀🎀【AI辅助编程系列】🎀🎀🎀 Visual Studio 使用 GitHub Copilot 与 IntelliCode 辅助编码 Visual Studio 安装和管理 GitHub Copilot Visual Studio 使用 ...

大家好,我是花生~ 就在昨天,知名开源大模型平台 Stability AI(以下简称 SAI)突然发布了新的 Stable Diffusion 3.5 模型。本以为在经历 SD 3 发布失利、核心成员出走、Flux 模型发布等一系列冲击后,...

0. 前言 世界模型 (World Model) 展示了如何通过在生成的想象环境中进行实验来训练模型(而不是在真实环境中进行训练),从而学习如何执行特定任务。世界模型很好的说明了如何将生成模型与其他机器学习技术(如强化学习)相结合使用解决实...

老规矩先贴官网代码: https://github.com/hiyouga/LLaMA-Factory/blob/main/examples/README_zh.md 但是我还是没有根据这个命令跑出来,所以还是上其他方法把,有简单的就用 背...
在 Windows 上部署 OpenAI Whisper:详细教程 OpenAI Whisper 是一个功能强大的多语言语音识别模型,能够处理多种音频格式并生成高质量的字幕文件。本文将详细介绍如何在 Windows 系统上部署 Whispe...

ControlNet 是 Stable Diffusion Web UI 中功能最强大的插件。基于 ControlNet 的各种控制类型让 StableDiffusion 成为 AI绘图工具中最可控的一种。 IP Adapter 就是其中的...

先看功能,PS-SD插件可以干些什么?可以简单的理解为把SD置入到了PS中,可以更方便的使用局部重绘等功能: 1.文生图,如同正常使用SD,在PS中直接生成智能对象图片 2.图生图,使用PS直接拼接草图,一键生成效果图 3.局部重绘,PS有...