
Faster-Whisper 实时识别电脑语音转文本
前言 以前做的智能对话软件接的Baidu API,想换成本地的,就搭一套Faster-Whisper吧。 下面是B站视频实时转写的截图 项目 搭建环境 所需要的CUDANN已经装好了,如果装的是12.2应该是包含cuBLAS了 没装的,可以...

前言 以前做的智能对话软件接的Baidu API,想换成本地的,就搭一套Faster-Whisper吧。 下面是B站视频实时转写的截图 项目 搭建环境 所需要的CUDANN已经装好了,如果装的是12.2应该是包含cuBLAS了 没装的,可以...

1 部署环境 step 1. 使用24GB显存以上的显卡创建环境 step 2. 创建好环境之后,关闭环境,使用无卡模式开机(有钱可忽略) step 3. 安装LLaMA-Factory git clone https://github.c...

大家好,这里是和你们一起探索 AI 的花生~ 随着 AI 技术的不断发展,AI 视频的生成效果也跨上了新的台阶,在画面质量、动作流畅度、角色一致性、提示词理解等方面均有明显提升,达到了 “以假乱真” 的水平。而工具变强大后,人们的想象力也得...

大家好,我是程序员晓晓 今天分享的是AI绘画Stable Diffusion中ControlNet控制网中的OpenPose模型,可以精准控制人物姿势,想摆什么pose,就摆什么pose,假以时日,多加练习,你也可以成为AI摄影师。 01、...

纯 C/C++ 中 [Stable Diffusion] 的推断 https://github.com/CompVis/stable-diffusion ## 特点 – 基于 [ggml](https://github.com/...

相信大家对于AI绘画肯定不陌生了,虽然AI绘画能够方便地生成图像,但是要让它生成用户期望的图像,不太容易。很多时候,生成几十张图片,才有1-2张能用的,俗称“抽卡”,这一直以来都是AI绘画的痛点之一。一款名为“ControlNet”的插件出...

本文档详细介绍了使用ChatGLM3-6b大模型、m3e向量模型、one-api接口管理以及Fastgpt的知识库,成功的在本地搭建了一个大模型。此外,还利用LLaMA-Factory进行了大模型的微调。 1.ChatGLM3-6b 2.m...
前言 Controlnet是Stable Diffusion中一个至关重要的功能,它极大地增强了图像生成的可控性。通过引入额外的条件,Controlnet使我们能够更精确地控制生成的图像内容。本教程将详细介绍如何在ComfyUI中使用Con...

全面理解Stable Diffusion采样器 原文:Stable Diffusion Samplers: A Comprehensive Guide 在 AUTOMATIC1111 的 SD webui 中,有许多采样器(sampler)...

文生图/txt2img 文生图是Stable Diffusion中最基础、最实用也是最好玩的功能。顾名思义,文生图通过简单的文字描述(英文)就能生成你想要的图片。当然这个图片肯定不是完美的,如若你想生成完美的、惊艳的图片,还需要深入了解和学...