
腾讯HunyuanDit代码解析
注意:本文仅供自己记录学习过程使用。 训练 全参训练过程 输入图像用VAE编码得到输入的x_start(1,4,128,128);文本的两个特征:bert的encoder feature(1,77,1024)和T5 的feature(1,2...

注意:本文仅供自己记录学习过程使用。 训练 全参训练过程 输入图像用VAE编码得到输入的x_start(1,4,128,128);文本的两个特征:bert的encoder feature(1,77,1024)和T5 的feature(1,2...

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。 大家好,我是水滴~~ 本文将深入探讨Stable Diffusion WebUI生成参数中的采样器和采样步数,旨在为读者呈现一个全面而细致的解析。我们将从采样器和采样步数的概念出...

一、LLaMA-Factory LLaMA-Factory项目 二、LLaMA-Factory环境搭建 1.基础环境搭建 基础环境需要 环境 推荐版本 CUDA 12.1 Python 3.11 PyTorch 2.4.0 具体安装可参考我...

github链接:链接 我这里使用anaconda来部署,debian12系统,其他linux也同样可以使用gpu或者cpu版本,建议使用n卡,rtx3060以上 一、前期准备 1.linux系统 链接:debian安装 链接:ubuntu...

本文基于webUI API编写了类似于webUI的Gradio交互式界面,支持文生图/图生图(SD1.x,SD2.x,SDXL),Embedding,Lora,X/Y/Z Plot,ADetailer、ControlNet,超分放大(Ext...
一、whisper简介 Whisper 是一种通用的自动语音识别(ASR)模型 OpenAI 开发并开源。该模型基于 68 万小时的多语言(98 种语言)和多任务的监督数据进行训练,具备多语言语音识别、语音翻译和语言识别等功能。Whispe...

本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(三):原版实现源码解读 天才程序员周弈帆 | Stable Diffusion 解读(一):回顾早期工作-CSDN博客...

前言 介绍 SD(Stable Diffusion)中,ControlNet绝对是一个绕不开的神器!它不仅能让你生成的图片更符合预期,还能控制线条、姿势、色彩等多种细节,真正做到“所想即所得”。 今天这篇文章,一图流展示ControlNet...

一、本地部署 Stable Diffusion 前言 目前市面上比较权威,并能用于工作中的AI绘画软件其实就两款。一个叫Midjourney(简称MJ),另一个叫Stable- Diffusion(简称SD)。MJ需要付费使用,而SD开源免...

Stable Diffusion Quick Kit 是一个 Stable Diffusion 模型快速部署工具包,包括了一组示例代码,服务部署脚本,前端 UI,可以帮助可以快速部署一套 Stable Diffusion 的原型服务。我们已...