
stable diffusion实践操作-常见lora模型介绍
系列文章目录 本文专门开一节写Lora相关的内容,在看之前,可以同步关注:stable diffusion实践操作 前言 Lora是微调模型,某品牌汽车(特斯拉),人物姿势(剪刀手),可以固定我们照片的特征:人物特征、动作特征、还有照片风格...

系列文章目录 本文专门开一节写Lora相关的内容,在看之前,可以同步关注:stable diffusion实践操作 前言 Lora是微调模型,某品牌汽车(特斯拉),人物姿势(剪刀手),可以固定我们照片的特征:人物特征、动作特征、还有照片风格...

大家好,这里是和你们一起探索 AI 的花生~ 最近在小红书上看到了很多非常好看的 AI 字体海报,基本做法就是在 Stable Diffusion 中通过 Lora 风格模型+ Controlnet 外形控制直接生成带字体的场景插画,加上排...

1 VITS2模型 1.1 摘要 单阶段文本到语音模型最近被积极研究,其结果优于两阶段管道系统。以往的单阶段模型虽然取得了较大的进展,但在间歇性非自然性、计算效率、对音素转换依赖性强等方面仍有改进的空间。本文提出VITS2,一种单阶段的文...

今日言论: 马斯克的管理风格非常独特,他不需要非技术性的中层管理人员,员工表现不佳就会被裁,也不喜欢大型会议。 -- 前特斯拉 AI 总监安德烈·卡帕西 深入解读:Tiled Diffusion,英文翻译为**平铺扩散,**也是一种深度学习...

大家好,我是程序员晓晓。 今天我们重点对tile模型的预处理器进行一个详细的讲解。 一. Tile模型预处理器介绍 点击ControlNet插件Tile模型下的预处理下拉菜单,会看到Tile模型对应的预处理器有几个选项。 blur_gaus...

https://github.com/runwayml/stable-diffusion?tab=readme-ov-file#reference-sampling-script 对于 1.5 模型,其中可能包括四部分:标准模型、文本编码器...

概要 Stable Diffusion 是一种先进的潜在扩散模型(Latent Diffusion Model),它在深度学习和概率建模领域具有开创性意义。它能够根据文本描述生成高质量、细节丰富的图像,并在图像修复、图像绘制、文本到图像转换...

“ 本文介绍SD生成三视图的几种方法:提示词直接输出、三视图LoRa微调和OpenPose控制骨架,其中openpose出图最稳定。三视图是电商模特和游戏角色作图的必备技能。让我们尽快掌握此商业变现能力……” 之前给大家安利过SD跟MJ最大...

在之前的文章中,我们使用ollama在本地运行了大语言模型,它可以与你聊天,帮助你理解和生成文本内容。使用coqui-tts在本地运行了文本转语音模型,它可以将大语言模型生成的文字转换成语音,让你的应用更有趣。今天我们将要介绍Stable ...

Stable Diffusion是一款功能异常强大的AI图片生成器。它支持文字生成图片,图片转图片,使用各种各样的模型来达到你想要的效果,还能训练你自己的专属模型。 简单来说,即使你没有绘画功底,只要文笔叙说的够详细准确也可以画出自己想要的...