【AIGC炸裂更新】OmniGen一键包,AI图像修改,AI人物迁移,多模态图片融合提示词,多模态图像理解,8bit量化版本,8G显存可玩

今天文章主题为一款由北京人工智能研究原提出的统一图像框架：OmniGen。OmniGen是一个统一的图像生成扩散模型，将多种图像处理任务集成到一个统一的简化框架中。与传统的扩散模型不同，OmniGen无需额外的模块如ControlNet或IP-Adapter即可处理多样化的控制条件。OmniGen的特点包括：

1. 统一性：OmniGen不仅能够执行文本到图像的生成，还内在支持多种下游任务，包括图像编辑、主题驱动生成和视觉条件生成。此外，OmniGen还能通过将它们转化为图像生成任务来处理一些经典计算机视觉任务，如边缘检测和人体姿态识别。
1. 简洁性：OmniGen的架构高度简化，消除了对额外文本编码器的需求，使得与现有扩散模型相比更加用户友好。它能够通过指令完成复杂任务，无需额外的预处理步骤，显著简化了图像生成的工作流程。
1. 知识迁移：得益于在统一格式中的学习，OmniGen能够有效地在不同任务之间转移知识，处理未见任务和领域，并展现出新的能力。

同时OmniGen团队还探索了模型的推理能力和链式思考机制的潜在应用，这是对通用图像生成模型的首次尝试。总之，OmniGen能够实现灵活和可控的图像生成，包括从文本生成图像、编辑生成图像的部分、基于生成图像中的人体姿态生成重绘，以及从另一图像中提取所需对象并整合到新图像中。它还能处理常见的图像生成任务和一些经典计算机视觉任务，如去模糊、去雨、修复以及人物姿态图和深度图。OmniGen展现了潜在的推理能力和一定程度的上下文学习能力，框架通过模仿人类逐步绘画的过程，迭代细化图像，从而处理更复杂和多样化的场景。此外，OmniGen的设计原则是通用性和简洁性，避免了过于复杂的结构设计和众多额外组件。为了实现强大的多任务处理能力，OmniGen训练了一个大规模和多样化的数据集，称为 X2I数据集，包含约0.1亿张图像。

• Github：https://github.com/VectorSpaceLab/OmniGen
• 项目主页：https://vectorspacelab.github.io/OmniGen/
• 在线体验地址：https://huggingface.co/spaces/Shitao/OmniGen

（不想自己下载的同学可自行扫描获取）

官方演示

灵活可控性

图像主体引用

常见图像任务

经典视觉任务

OmniGen ComfyUI体验

社区已有 @chflame163大佬的 ComfyUI_OmniGen_Wrapper支持ComfyUI中的体验，需要通过插件管理器GIT安装ComfyUI_OmniGen_Wrapper插件。首次运行插件时将自动下载模型。

• 插件地址：https://github.com/chflame163/ComfyUI_OmniGen_Wrapper
• Shitao/OmniGen-v1：需要下载Shitao/OmniGen-v1模型全部模型文件，并复制到ComfyUI/models/OmniGen/Shitao/OmniGen-v1文件夹。地址：https://huggingface.co/Shitao/OmniGen-v1/tree/main

Flux文生图工作流

OmniGen工作流

OmniGen核心节点

• image_1: 可选输入图片1。如果输入，须在prompt中描述此图，用{imgae_1}指代。
• image_2: 可选输入图片2。如果输入，须在prompt中描述此图，用{imgae_2}指代。
• image_3: 可选输入图片3。如果输入，须在prompt中描述此图，用{imgae_3}指代。
• dtype: 模型精度，default为模型默认精度, 可选int8。默认精度大约占用12GB显存，int8大约占用7GB显存。
• prompt: 生成图片的提示词。如果有图片输入，请用{imgae_1}、{imgae_2}、{imgae_3}指代。
• width: 生成图片的宽度，必须为16的倍数。
• height: 生成图片的高度，必须为16的倍数。
• guidance_scale: 引导比例。较高的值会使模型的生成结果更倾向于条件，但可能损失图像的多样性和自由度。
• image_guidance_scale: 图片引导比例。
• steps: 图片生成推理步数。
• separate_cfg_infer: 在不同引导下分别对图像进行推理；这可以在生成大尺寸图像时节省内存，但会使推理速度变慢。
• use_kv_cache: 使用kv缓存以加快推理速度。
• seed: 随机种子。推理使用不同的种子产生不同结果。
• control_after_generatel: 每次运行时种子值变化选项。
• cache_model: 设置为True时缓存模型，下次运行无需再次加载模型。

注意：

• 提示词需要按照固定格式 **{imgae_1}**引用对应图像，模型会自动编码为格式。示例提示：2 person in the photo, The person in {image_1} on left and the person in {image_2} on right
• 在1张图25步情况下，8位量化需要56.59秒。默认全精度则需要69.34秒。

8位量化：

全全精度：

01. 基础文生图

(masterpiece, top quality, best quality, official art, beautiful and aesthetic:1.2), (1girl), extreme detailed,(fractal art:1.3),colorful,highest detailed..

02. 多图融合

测试中发现对输入图质量和角度要求较高（尽量使用正面高清图），实际出图与提示位置理解遵循仍需要抽卡。另外S****DXL的手问题仍让是大问题。

 2 person in the photo, The person in {image_1} on  left and the person in {image_2} on  right

在这里插入图片描述

03. 美女合影

2 person in the photo, The person in {image_1} on  left and the person in {image_2} on  right

在这里插入图片描述

03. 单图识别

OmniGen不仅支持文生图、多图融合，同时还支持单图编辑功能（标注物体、改变物流艳色、移除物体、生成pose图、生成深度图、生成线稿图等）。但由于插件当前可能存在issue，无法测试，将在后续文章补充。另外笔者之所以选择**@chflame163大佬的ComfyUI_OmniGen_Wrapper**这款ComfyUI插件，因为测试出图效果这是最能接受的插件，不满意的出图质量是一直推迟推文的原因。

资料软件免费放送

次日同一发放请耐心等待

学好 AI绘画不论是就业还是做副业赚钱都不错，但要学会 AI绘画还是要有一个学习规划。最后大家分享一份全套的 AI绘画学习资料，给那些想学习 AI绘画的小伙伴们一点帮助！

需要的可以扫描下方CSDN官方认证二维码免费领取【保证100%免费】

**一、AIGC所有方向的学习路线**

AIGC所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。

二、AIGC必备工具

工具都帮大家整理好了，安装就可直接上手！

三、最新AIGC学习笔记

当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。

四、AIGC视频教程合集

观看全面零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

五、实战案例

纸上得来终觉浅，要学会跟着视频一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

这份完整版的学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

文章来源于互联网:【AIGC炸裂更新】OmniGen一键包,AI图像修改,AI人物迁移,多模态图片融合提示词,多模态图像理解,8bit量化版本,8G显存可玩

相关推荐: comfyui入门｜超详细安装教程（汉化+管理器）

前言今天我给大家分享的是怎么安装comfyUI。网上安装comfyui的教程有很多，但是说的有点偏复杂了，特别是安装节点的时候，其实没那么难，这篇文章我就给大家分享下如何快速安装comfyui及各个节点的安装卸载。其实刚开始我也摸索了很久，遇到很多问题，…

【AIGC炸裂更新】OmniGen一键包,AI图像修改,AI人物迁移,多模态图片融合提示词,多模态图像理解,8bit量化版本,8G显存可玩

OmniGen简介

官方演示

灵活可控性

图像主体引用

常见图像任务

经典视觉任务

OmniGen ComfyUI体验

Flux文生图工作流

OmniGen工作流

OmniGen核心节点

01. 基础文生图

02. 多图融合

03. 美女合影

03. 单图识别

学好 AI绘画不论是就业还是做副业赚钱都不错，但要学会 AI绘画还是要有一个学习规划。最后大家分享一份全套的 AI绘画学习资料，给那些想学习 AI绘画的小伙伴们一点帮助！

相关推荐

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来

OmniGen简介

官方演示

灵活可控性

图像主体引用

常见图像任务

经典视觉任务

OmniGen ComfyUI体验

Flux文生图工作流

OmniGen工作流

OmniGen核心节点

01. 基础文生图

02. 多图融合

03. 美女合影

03. 单图识别

学好 AI绘画 不论是就业还是做副业赚钱都不错，但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料，给那些想学习 AI绘画 的小伙伴们一点帮助！

相关推荐

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来

学好 AI绘画不论是就业还是做副业赚钱都不错，但要学会 AI绘画还是要有一个学习规划。最后大家分享一份全套的 AI绘画学习资料，给那些想学习 AI绘画的小伙伴们一点帮助！