全网最干喂饭教程！10个案例带你全方位玩转WHISK（上）

2025-02-05 分类：AI创作阅读(900)

文章目录 隐藏

哈啰大家好，好久不见啦~~2025 年好呀~~这里是和你一起探索 AIGC 美学边界的戏呱皮 DC。大家可以叫我呱呱。最近网上爆火的巨物卡通 IP 占领人类城市系列的视频，大家有看过吗？呱呱也在小红书发布了这个内容的创意视频~

什么是 Whisk

在开始实操之前，我们先简单介绍一下 whisk。

Whisk 呢是谷歌推出的 AI 图像生成工具，支持用户上传图像指定生成图像的主题、场景和风格，无需长文本提示。用户能为每个类别提供多张图像，或用谷歌自动填充的 AI 生成图像作为提示。Whisk 能快速视觉探索，支持用户编辑底层提示优化结果。说白了呢，就是一款不需要调节参数无脑上手的创意出图网站。

Whisk 的主要功能

图像提示生成：用户能上传图像提示，AI 生成新图像。
多图像输入：用户能为主题、场景和风格分别提供多张图像，指导 A1 生成具有特定特征的图像。
自动图像提示：如果没有合适的图像，用户用谷歌自动填充的 AI 生成图像作为提示。
额外细节添加：用户在生成流程的最后阶段用文本框输入额外的文字细节，进一步指导图像的生成。
图像生成与调整：Whisk 生成图像后，用户能对结果进行查看和调整。

Whisk 的生图原理

Whisk 的原理并不复杂，它会根据你提供的图片生成对应的文字描述，再将这段描述作为提示文字返回给 AI，从而生成相应的新图片，完成“图生图”的过程。

在技术层面上，Whisk 的后端使用 Gemini 模型自动为输入的图片生成详细描述，之后将这些描述输入到 Google 最新的图像生成模型 Imagen 3 中，这一过程并非对原图的简单复制，而是通过捕捉图像的特点，在风格与内容上进行重塑，从而帮助用户实现主题、场景和风格的自由混合与创新。

Google 在官网中表示，Whisk 的设计初衷是“快速进行视觉探索，而非像素级的精准编辑”。这种定位使 Whisk 更适用于创意发散的初期阶段，帮助用户快速试验不同的视觉风格与构图。同时，Google 也承认 Whisk 有时可能“未能完全达到预期”，因此提供了编辑提示输入的功能，确保用户能够轻松地修正优化生成结果。
通过不同设计方向的使用测试，Whisk 给了呱呱很大的惊喜。呱呱相信随着 Google 不断优化其 AI 模型，Whisk 有望成为提升设计师创意效率的 AIGC 工具。

Whisk 的官网地址

网址：https://labs.google/fx/zh/tools/whisk

Whisk 的使用要求和费用

使用要求：需要用谷歌账号进行登录，且只有美区的上网节点才可以打开
（这一点只要你能魔法上网，选择区服是美国区域的即可）
费用说明：免费的

Whisk 的实操案例

案例一：万物皆可变玩偶

① 进入whisk生图主页面

whisk 的生图页面非常简单和直接，可以看到主页面只有三个区域：样式设定区、图片添加和生成区、可选图片区。

whisk 网站样式设定区默认是 3 个选项：贴纸、珐琅徽章和长毛绒。（至于如何设定其他样式，后面呱呱会讲到）

咱们打开网站后，可以看到左侧是一张玩偶的预览图，对应的就是网站的 PLUSHIE(长毛绒）的样式。

呱呱碎碎念：

你可以理解为样式选择“长毛绒”后，放置在主题位置的任何图片，都会被 whisk 转换为长毛绒质感，即「万物即可长毛绒」。

②选择主题图并直出玩偶效果

这一步，我们可以先拿 whisk 网站已有的素材图，测试下效果。（拿 whisk 提供的粉色咖啡杯为例）

呱呱注释：

whisk 这个页面中，不需要找提交或者什么按钮，就把图片拖动到对应位置后。该图片周边一圈变成滚动的蚂蚁线就是在运行了。也就是说只要咱们把图拖上到指定位置，whisk 就默认你要生图就直接运行了。（不能取消的哦，免费的取消它干啥~~）

那么如何上传自己的图呢？（步骤见下图↓）

③进入图片优化页面

回到前面我们转化的那张粉色咖啡杯的图，可以看到生成的预览图中，我们的粉色杯子确实转化成了长毛绒质感的。但是纹路图案不太对，这时候怎么办呢？如何优化修正呢？如图，咱们就点击预览图下方的功能按钮“在工具中打开”，我们会跳转到一个新的页面。

可以看到新页面中简单明了的划分了 3 个操作区：生成图预览区、关键词输入区（支持中文输入）和设定区。

呱呱注释：

关键词输入框处如果是做的 IP 类的或者细节很多的内容建议还是用 deepl 的英文翻译比较好。谷歌的翻译有些内容不准确，呱呱实测。

④优化生成的图片

把鼠标移动到咱们生成的其中一张图上，可以看到图片上浮现了几个功能按钮。

左上角有：优化和编辑图像

右上角是：点赞、下载和删除

左下角是：标记

此时，如果选中的图中没有我们想要的某部分，我们可以选择左上角第一个功能“优化”，去添加对应的提示词生成新的图。

比如此处呱呱想在左侧图片上添加这样的内容：

碟子是长毛绒质感的，背景有长毛绒质感的蓬松的云朵。

可以看到图中，背景有了长毛绒质感的蓬松云朵，但是杯子和碟子全部没有了长毛绒质感。

⑤编辑生成图的提示词

此时，咱们直接选择左上角第二个功能按钮：“编辑图像”。

当我们点击这个“编辑图像”，并进入提示词后，我们会看到我们生成图所对应的一大串提示词内容。咱们翻译过来看下都写的什么~

A pastel pink teacup and saucer, appearing to be made of a soft, plush material, sits against a background of similarly textured, fluffy pink clouds. The teacup is round with a slightly flared rim and a curved handle, decorated with small, evenly spaced, slightly raised pastel blue-lavender circles on a pastel pink background. The saucer is round, with an iridescent finish displaying subtle rainbow-like shifts in color. The teacup contains a pale, almost transparent liquid.

粉红色的茶杯和茶托似乎由柔软的毛绒材料制成，背景是质地相似、蓬松的粉红色云朵。茶杯呈圆形，杯沿略微外扩，杯柄呈弧形，粉色背景上饰有均匀分布、微微凸起的粉蓝色-淡紫色小圆圈。茶托是圆形的，表面有彩虹般的微妙色彩变化。茶杯中装有淡淡的、几乎透明的液体。

从图片对应的提示词中可以看到，关于杯子的长毛绒质感并没有那么明确和细节。所以此时呱呱把提示词按照需要的效果内容进行调整，并复制到输入框中（此处呱呱用的是 deepl 翻译网站，比较准确）：

网址：https://www.deepl.com/zh/translator

中文：

一个淡粉色的茶杯和茶碟，是由柔软的长毛绒材料制成的，坐落在同样纹理蓬松的粉红色云的背景上。这款长毛绒材质的茶杯是圆形的，边缘微微张开，手柄弯曲，在淡粉色的背景上装饰着间距均匀、密集的、微微凸起的淡蓝色薰衣草长毛绒小圆圈。长毛绒材质的碟子是圆形的，带有彩虹色的饰面，在颜色上呈现出微妙的彩虹般的变化。茶杯里的液体也是长毛绒质感的。整个场景都是长毛绒质感的。

Deeple 翻译：

A pale pink teacup and saucer, made of soft plush material, sits against a background of similarly textured fluffy pink clouds. Rounded with slightly splayed edges and curved handles, the plush teacup is decorated with evenly spaced, dense, slightly raised pale blue lavender plush circles against a pale pink background. The plush-material saucer is round with a rainbow-colored finish that presents a subtle rainbow of variations in color. The liquid in the teacup is plush. The whole scene is plush.

呱呱碎碎念：

此时看到这张图片对应的提示词，以及可以编辑的这个操作。有没有悟了~谷歌的 whisk 就是把咱们的主题图片和样式图片进行了读取和对应提示词的提取，并综合在一起去出了一张图。悟了吧~原理是很简单粗暴好理解的~

⑥效果过程展示

⑦其他主题图转化尝试

前面我们以“whisk 平台提供的图片”+“长毛绒样式”的组合方式，详细拆解了如何使用 whisk 进行毛绒玩偶化的步骤和优化操作。现在让我们看看建筑、人物照片、插画等不同出图条件下 whisk 的表现：

⑧亿点技巧

前面呱呱给大家展示了关于「万物皆可变毛绒玩偶」的很多图片转化案例，这里呱呱总结了一点小技巧分享给大家：

1) 进入首页后，点击功能按钮“从头开始”，使用图片+提示词来综合控制出图效果。

2) 简单画面建议没有提示词直出。

3) 复杂画面则建议除了提供参考图，还需要输入尽量准确详细的提示词。

如果细节很多，还是要仔细描述清楚的，不然 whisk 自行扫描提取语义信息肯定会有不理想的情况。

4) IP 类内容的提示词尽量用自己翻译检查后的英文。

从最后一个派大星的案例中可以看出，我们直接输入中文，让 whisk 后台自行翻译的英文输出的图片效果不理想。而当我们把内容自行用网易有道或者 deepl 翻译成英文再复制过来使用的时候，派大星的形象才是对的。

案例二：万物皆可变贴纸

从这个案例开始，呱呱就带大家直接进入可编辑可控制效果的生图页面进行操作了。

① 进入whisk生图可编辑页面

在 whisk 主页下方，找到“从头开始”，点击进入更自主化的生图页面。

② 设定样式和尺寸

选择左上角的三条杠，调出样式设定和尺寸设定，设定自己需要的尺寸和样式。

此处呱呱设定的样式是 Sticker（贴纸），尺寸选择默认的 Landcape（16:9）的。

③选择或者上传一张设计图

当我们把样式选择好后，生图页面上“样式”区域的参考图则已经打上“√”了。

这时候我们需要做的则是把“主题”图片上传好或者用文本输入好，本次示例呱呱选择使用图片。第二个类型 SCENE（场景）的图片可有可无，看个人选择。如果你选择上传一张场景，则生成图的参考图为：主题参考图+SCENE（场景）参考图。

此处呱呱使用 WHISK 的一个功能“筛子”，让系统随机的生成不同的图来测试效果。

呱呱注释：“筛子”功能就是摇骰子，系统会随机给出一张主题图，一张 SCENE 图，一张样式图。

呱呱碎碎念：

每次点击筛子按钮后，主题、SCENE（场景）和样式都会随机增加一张图。

④生成看效果

呱呱只是测试效果此处就不写提示词，点击“→”直接生成合并图片了。

⑤其他图片转化贴纸的尝试效果

如果想用自己的图片，同时又不想删除前面的图。则可以使用 WHISK 的“添加更多”功能。这个功能可以自由的在选择的类型下添加 1 个空白的图片框（每次点击只能选择一个类型添加，每次一张图，但可以无限点击）。

本次教程呱呱全程都是用的上传图片，因为 WHISK 最擅长的就是“图生图”。下面是呱呱用其他类型的图的效果测试，大家可以看下效果。

⑥亿点技巧

当我们使用场景比较复杂的图进行图生图的时候，不写提示词往往画面很不准确。比如下图这张国风质感的场景，细节很多，不好描述。直出或者结合原图的中文提示词或者英文提示词效果都差一点。

这时候我们可以这样做：

1) 使用 joy1 反推图片，得到场景的具体提示词

网址：https://huggingface.co/spaces/fancyfeast/joy-caption-pre-alpha

This is a vibrant, digital illustration depicting a serene Asian woman in a traditional Chinese outfit. She is positioned centrally in the image, her eyes closed and her hands pressed together in a prayer-like gesture. Her long, dark hair is styled in an elaborate updo adorned with white and yellow flowers. She wears a white silk robe with intricate green embroidery and a teal sash around her waist, adding a touch of color to her attire.

Surrounding her are two small birds perched on her shoulders, one black with a white breast, and another with a yellow breast. The background features a picturesque village scene with lush greenery and traditional Chinese houses with red-tiled roofs. In the distance, there are several figures, including a man in a blue shirt and a woman in a red dress, suggesting a festive atmosphere. The sky is a bright blue with fluffy white clouds, adding to the idyllic setting. The overall style is detailed and colorful, with a soft, watercolor-like texture that enhances the peaceful and harmonious mood of the illustration.

2) 复制反推得到的英文提示词到输入框，结合参考图生成合成图片。

3) 点击生成图片的“编辑图像”功能，把反推的提示词再次复制进去，再次生成。

可以看到细节优化了很多，和参考图更像了。但因为我们在写提示词的时候没有把每部分场景都和“贴纸”进行语言上的结合，所以贴纸的感觉就很弱了，这里大家根据自己需要选择是优化提示词还是简单化。

案例三：万物皆可变珐琅别针

① 进入whisk生图可编辑页面

同前面步骤一样的，呱呱就不多赘述了。

② 设定样式和尺寸

选择左上角的三条杠，调出样式设定和尺寸设定，设定自己需要的尺寸和样式。
此处呱呱设定的样式是 Sticker（贴纸），尺寸选择默认的第一个选项：Landcape，也就是（16:9）的。

③ 使用系统提供的主题图或者自己上传一张。

当我们把样式选择好后，生图页面上“样式”区域的参考图则已经打上“√”了。

接着是上传主题图，呱呱是使用 whisk 的“摇色子”功能让系统随机给出一张主题图和一张 SCENE 图和一张样式图。

④写提示词

如果是简单的内容，可以不写。此处呱呱是为了给大家演示步骤，就不去仔细编辑提示词了。此处呱呱直接根据网站提示，点击“→”生成合并图片。

⑤生成看效果

⑥优化图片提示词

如果想调整优化效果，可以点击图片的“优化”或者“编辑图像”功能，对提示词进行优化。

也可以直接点击图片，进入“编辑图像”页面，优化提示词。

呱呱碎碎念：切记，whisk 的逻辑就是识别图片生成该图片的提示词，图片+图片=提示词+提示词

④ 其他图片转化珐琅别针的尝试效果

其他效果如图：

上篇暂告一段落，想学的记得关注我和优设网哦。

*标题“全网”指代优设网。

文章来源于互联网:全网最干喂饭教程！10个案例带你全方位玩转WHISK（上）

相关推荐: AIGC行业现在适合进入吗

简介： AIGC行业是一个融合人工智能、自然语言处理、计算机视觉和机器学习等多个技术领域的新兴行业。当前时机对于进入AIGC行业来说，具有一定的适合性行业前景 AIGC行业在当今数字化时代具有巨大潜力，涉及领域广泛，包括人工智能、大数据、物联网和云计算。随…

未经允许不得转载：5bei.cn大模型教程网 » 全网最干喂饭教程！10个案例带你全方位玩转WHISK（上）

全网最干喂饭教程！10个案例带你全方位玩转WHISK（下）

2025-02-04 分类：AI创作阅读(0)

往期回顾：

案例八：一张 IP 色稿得到三视图/3D 图/场景延展图

同前面步骤一样的，咱们直接进入可编辑可控制效果的生图页面进行操作了。

① 进入whisk生图可编辑页面

同前面步骤一样的，呱呱就不多赘述了。

② 设定样式和尺寸

呱呱本次所有示范案例均用的是默认尺寸，16：9 的。大家可以根据自己的需求选择是 1:1 还是 9:16
本案例不需要设定样式。

③上传IP色稿图

本案例要用到的是一张 IP 色稿图。

④写提示词得到三视图

首先，本色稿图是使用即梦 AI 出的。

网址：https://jimeng.jianying.com/ai-tool/home/

出图模型及提示词为：

所以在 whisk 输入框中，呱呱将沿用出图时描绘 IP 的提示词，并结合所需视图和质感需求输入相应的提示词：

巨物主义，三视图，正视图侧视图和后视图，一只可爱拟人化的 Q 版小白兎，垂耳兔，毛茸茸的玩偶，柔软的白色毛发，温暖的微笑，脸颊泛着红晕，戴着红色贝雷帽，身穿红色针织毛衣，左手捧着用牛皮纸包裹的新鲜樱桃花束，胸前斜挎着一只带有爪印细节的蓝色小包

具体效果见下图：

呱呱提醒：如果你想你出的 3D 玩偶和色稿特征保持大范围的一致性，那么你的提示词必须仔细准确、详细详尽的说明想出图的描述。特别是对 IP 的描述，什么颜色什么特征什么服饰等都要仔细说明白。

⑤上传玩偶样式图并调整提示词得到3D三视图

调整的提示词为：

巨物主义，三视图，正视图侧视图和后视图，真实 3D 质感，一只可爱拟人化的 Q 版小白兎，垂耳兔，毛茸茸的玩偶，柔软的白色毛发，温暖的微笑，脸颊泛着红晕，戴着红色贝雷帽，身穿红色针织毛衣，左手捧着用牛皮纸包裹的新鲜樱桃花束，胸前斜挎着一只带有爪印细节的蓝色小包，真实质感，

⑥结合实景得到场景拓展图

首先上传一张 SCENE 图，即场景图。

接着，我们输入 IP 描述词、质感词和对应的场景视角词，用中文即可。我们会得到如下的效果：

呱呱碎碎念：是不是很惊喜，IP 特征维持的很好。这主要是我们提示词对于 IP 特征的描述足够清晰和丰富。

同样的方法我们会得到以下这些图：

⑦完整IP延展图展示

由此，我们就由一张色稿图，得到了这个 IP 的三视插画图、三视 3D 图、场景延展图、实景结合图。

不得不说 whisk 算是呱呱用过的各种 AIGC 工具中，对于 IP 色稿保持一致性最简单最完整的一个工具了。特别是色稿转 3D 的表现相当优秀~~！！！当然这个的前提是你的提示词描述的足够清晰，IP 特征足够具体~~~

案例九：电商产品+场景创意结合

同前面步骤一样的，咱们直接进入可编辑可控制效果的生图页面进行操作了。

① 进入whisk生图可编辑页面

同前面步骤一样的，呱呱就不多赘述了。

② 设定样式和尺寸

呱呱本次所有示范案例均用的是默认尺寸，16：9 的。大家可以根据自己的需求选择是 1:1 还是 9:16
本案例不需要设定样式。

③上传所需图片

本案例要结合的是产品图+创意场景图，由此呱呱在主题区上传了一张香水的图片，在 SCENE 区上传了一张想生成的场景图。

呱呱碎碎念：

注意了，whisk 不是 sd，whisk 同 MJ 一样。没有 controlnet 等插件去严格控制轮廓边缘。whisk 的原理是把我们上传的参考图反推成提示词，综合一起去生成一张新的图。所以关键在于提示词是否准确和详尽。

④写提示词

为了让场景风格不出现太大的偏差，呱呱是建议写上你对场景的描述，比如此处呱呱写的提示词是：

产品摄影，月亮，倒影，一瓶香水放在中心的石头上，周边是水，奢侈品，意境，极简，装饰着樱花

也给大家看下如果不写提示词，纯粹靠 whisk 自己的反推提示词能力，效果是什么样的：

可以看到整体效果还可以，但因为 whisk 的原理是反推参考图的提示词，所以如图主题图中的柠檬等水果也被生成出来了。

⑤更多场景效果

再给大家看一组场景效果，一如既往两步走：

1) 先上传一张 SCENE 图

2) 输入希望生成的场景的提示词：

一瓶香水放置在一片茂密的森林中，周围环绕着各种植物，如粉玫瑰、柠檬、粉色苔藓，整个画面以粉色调为，倒影，水波纹，增加了画面的纵深感和质感，瓶子被聚焦在画面中央，周围的环境包括植物和水都被虚化处理，自然光源，明亮通透，商业拍摄，产品摄影，极简主义，磨砂质感，32K

看效果：

呱呱碎碎念：

个人感觉 whisk 很适合做提案，毕竟很方便很简单，效果也蛮好的。有点类似融图的概念。如果之后 whisk 可以控制轮廓了就无敌了。

一样的看下不输入提示词，主题图+SCENE 图直出的效果：

有没有又悟了呢~~场景丰富的时候或者我们对场景有准确需求的时候，千万别忘记输入提示词哦~~提示词是起到引导和指导效果的作用的~

案例十：创意视频之巨物皮卡丘睡在长城上

同前面步骤一样的，咱们直接进入可编辑可控制效果的生图页面进行操作了。

① 进入whisk生图可编辑页面

同前面步骤一样的，呱呱就不多赘述了。

② 设定样式和尺寸

呱呱本次所有示范案例均用的是默认尺寸，16：9 的。大家可以根据自己的需求选择是 1:1 还是 9:16
本案例不需要设定样式。

③选择或者上传一张设计图

本案例要结合的是皮卡丘+长城，所以准备了 2 张图。

④写提示词并生成创意图

文本内容比较简单，场景内容也简单，皮卡丘知名度也够，英文上也没有说法的存疑，所以此处呱呱就写中文了。

提示词内容为：巨大的比卡丘，毛茸茸的，躺在长城上睡觉。露着肚皮，巨物主义，使用佳能相机拍摄

⑥图片转成视频动图

进入可灵 AI，上传做好的创意图，选择视频模型，并输入提示词：

比卡丘在长城上睡觉，均匀的呼吸，肚子随着呼吸起伏，长城被压得微微晃动，电火花在它的周边刺啦闪动

网址：https://klingai.kuaishou.com/

⑦剪辑优化视频

进入剪影电脑版/APP 都可以，将生成的视频导入进去，增加睡觉打呼噜的音效、加入背景音乐、视频与视频之间增加叠化转场。

如图：

⑧视频成果欣赏：
大家可以移步呱呱的小红书看视频

其他知识点补充

① 一些重要的2个注意点

whisk 的过往图片参数是无法复现的，如果你要写教程什么的，同一个案例不要中断，一定要一次测试完全。
whisk 出的图，当天的图就直接在页面批量下载。因为下次再打开的时候，在历史图片页面中无法批量下载图片。

②如何一键下载当前页面所有图片

操作见下图：

③如何查看历史图片

操作见下图：

呱呱碎碎念：

注意，操作过程中想看历史图片，一定要用鼠标右键的“在新窗口打开”。否则当前页面会直接跳转到“我的库”，你之前上传好的图就都没了，要重新上传~~

④从“我的库”下载历史图片的注意事项

从我的库下载历史图片时，一定要点击打开图片再去下载。不要直接从缩略图处下载！不要直接从缩略图处下载！不要直接从缩略图处下载！重要的事情说三遍！！！呱呱惨痛的经历！从缩略图点击下载的是很小很糊的图，要下载大图只能点开图片，从点开的图片处下载才是大图。。。。

呱呱碎碎念：

最好的就是咱们作图的时候，从当前页面就使用②呱呱写的“如何一键下载当前页面所有图片”的方法，做图的时候就同步下载下来。这样可以避免很多麻烦~~

好了，以上就是呱呱分享的全部教程，够充实够干货吧~~基本上 whisk 所有的使用方向呱呱都给大家做了展示。大家可以去玩一下子，还挺有意思的。喜欢的话记得点赞、收藏、评论三连支持一波，呱呱会更有动力为大家分享更多 AIGC 零基础喂饭教程。也期待你的作业返图啦~最后祝大家春节快乐~~！！拜拜拜拜~~

*标题“全网”指代优设网。

文章来源于互联网:全网最干喂饭教程！10个案例带你全方位玩转WHISK（下）

相关推荐: 【粉丝福利社】AI 绘画：Stable Diffusion ComfyUI的艺术

标题详情作者简介愚公搬代码头衔华为云特约编辑，华为云云享专家，华为开发者专家，华为产品云测专家，CSDN博客专家，CSDN商业化专家，阿里云专家博主，阿里云签约作者，腾讯云优秀博主，腾讯云内容共创官，掘金优秀博主，亚马逊技领云博主，51CTO博客专家…

未经允许不得转载：5bei.cn大模型教程网 » 全网最干喂饭教程！10个案例带你全方位玩转WHISK（下）

全网最干喂饭教程！十个案例带你全方位玩转WHISK（中）

2025-02-03 分类：AI创作阅读(0)

案例四：万物皆可变冰冻/剪纸/岩彩……

同前面步骤一样的，咱们直接进入可编辑可控制效果的生图页面进行操作了。

① 进入whisk生图可编辑页面

同前面步骤一样的，呱呱就不多赘述了。

② 设定样式和尺寸

我们此处要参考的样式图不是系统提供的，需要自己上传，操作如图：

③选择或者上传一张设计图

本案例以冰冻质感示范，如图样式上传一张冰块材质的图，主题上传一张天坛的照片。

④写提示词

因为示范是场景图，想要生成冰雕的质感，此处呱呱为了控制效果，加了中文提示词：冰雪制成的北京天坛，冰雪覆盖的北京天坛，居中构图，冰雪，霜花，冰雕

⑤生成看效果

点击输入框尾端的→，生成合并图片

我们可以看下效果：

如果不满意，想要更细节的控制效果，操作如前几个案例。可以直接点击图片，进入“编辑图像”界面，可以看到生成图对应的提示词。

我们直接把自己的提示词复制进去或者优化图片对应的提示词内容。

⑥其他样式效果对比展示（剪纸、岩彩）

通过上述的对比，相比大家更深入的了解了 whisk 的生图原理吧。大家也可以根据各自的需求选择是直出还是添加提示词进行辅助。当然效果也可以在生图后通过编辑优化提示词再次出图。

案例五：文字+场景的创意

① 进入whisk生图可编辑页面

同前面步骤一样的，呱呱就不多赘述了。

② 设定样式和尺寸

呱呱本次所有示范案例均用的是默认尺寸，16：9 横幅的。大家可以根据自己的需求选择是方块 1:1 还是肖像画 9:16。
本案例不需要单独设置样式，直接在对应位置上传图片即可。

③选择或者上传一张设计图

本案例要结合的是英文内容+沙漠场景，所以准备了 2 张图，并上传到对应位置：主题和场景。

呱呱碎碎念：

注意了，whisk 不是 sd，没有 controlnet 等插件去严格控制轮廓边缘，所以只能测试英文，并且这里的英文内容只能提供一个内容参考给到 whisk，起到一个辅助作用，告诉它我们要结合什么文本内容而已。

④写提示词

文本内容比较简单，场景内容也简单，此处呱呱就写的中文：

一组巨大的字母形状的建筑，落地在沙漠之中。字母”XGUAPIDC2025″由沙子堆积而成，砂砾质感，古城楼。巨物主义，超现实

⑤生成看效果

呱呱注释：

再次说明！！whisk 不是 stable diffusion，没有 cn 那种控制轮廓的插件配置，无法产出中文的。这点和 MJ 是一样的，图片只是参考图，whisk 后台会反推图片内容生成对应的提示词，再把提示词合并一起生成新的图。中文是没法被描述的，也期待后续 whisk 的更新~~

案例六：品牌 LOGO 超级符号+场景的创意

同前面步骤一样的，咱们直接进入可编辑可控制效果的生图页面进行操作了。

① 进入whisk生图可编辑页面

同前面步骤一样的，呱呱就不多赘述了。

② 设定样式和尺寸

呱呱本次所有示范案例均用的是默认尺寸，16：9 的。大家可以根据自己的需求选择是第二个选项 1:1 还是第三个选项 9:16。
本案例不需要设定样式。

③选择或者上传一张设计图

本案例要结合的是抖音 LOGO+上海城市场景，所以准备了 2 张图。

呱呱碎碎念：

注意了，whisk 不是 sd，whisk 同 MJ 一样，没有 controlnet 等插件去严格控制轮廓边缘的。如果想生成风格化的超级符号图片，只能选择在海外有名的品牌。比如此案例呱呱用的是抖音，因为抖音在海外也很有名。不加图片，用文字输入也可以，加图片是起到一个辅助提示的作用。

④写提示词

文本内容比较简单，场景内容也简单，此处呱呱就写中文了。

提示词内容为：

巨物主义，中远景中，一个云朵组成的“tiktok“LOGO，云朵 LOGO，出现在上海东方明珠的上空，现实和虚拟的结合，超现实主义

⑤生成看效果

也给大家看下如果不写任何提示词，就是一张白底黑色 LOGO 和一张上海背景图，whisk 会给出什么图：

那如果我们把抖音 LOGO 图换成一张自带颜色效果的图，又会怎么样呢？

通过这一系列的对比，不知道各位看官是否对 whisk 再次加深了认知呢~~

⑥其他品牌LOGO的创意风格图测试

whisk 是海外的 AIGC 平台，所以只能识别有国际知名度的品牌。且识别的也是这个品牌在海外的品牌形象。比如支付宝，我们国内的 LOGO 是个“支”字，但是海外给出的是“Alipay”。

以下是呱呱做的几组其他品牌的 LOGO 尝试，给大家一个参考：

案例七：人物场景风格重绘（实景转插画）

同前面步骤一样的，咱们直接进入可编辑可控制效果的生图页面进行操作了。

① 进入whisk生图可编辑页面

同前面步骤一样的，呱呱就不多赘述了。

② 设定样式和尺寸

呱呱本次所有示范案例均用的是默认尺寸，16：9 的。大家可以根据自己的需求选择是 1:1 还是 9:16
本案例不需要设定样式。

③选择或者上传所需图片

本案例要结合的是人物+样式参考图。

呱呱注释：

主题图即上传一张图片作为特征提取参考、内容信息参考；样式图即风格参考、质感参考、色调参考等。

④关于写提示词和优化

我们可以先不写提示词，直接生成一张看下效果。

可以看到谷歌的 whisk 自行提取的图片信息而去生成的合并图片并没有很好的还原我们样式参考图的风格。因为我们上传的样式参考图不是毛绒、冰雪这种简单的质感，比较复杂。这个时候我们在输入框中输入一定的提示词：引导一下 whisk，说明我们的色调和风格。

提示词内容为：

流体水墨,陈家冷,william,morris,ray,caesar,线条插画，工笔画风格，一个女孩，在卧室看书，书房是丰富的，堆满了各种小物件，复古

明显可以看到质感和元素已经不一样了。如果还想要进一步精确的控制画面的细节和主题内容，还可以根据需要对画面提示词进行优化。操作为：点击图片，进入“编辑图像”功能，复制新的提示词进入或者优化生成图的提示词（注意了，这里就只能是英文了哦~）

⑤亿点技巧：

我们其实可以在最开始的时候，就可以不用 whisk 的直出反推提示词。可以直接对上传的参考图进行提示词的优化，以达到相对准确的表达。

⑥结合场景出图

我们可以上传一张插画的场景，看看实景照片+插画场景+卡通插画样式，会碰撞出什么火花。

操作如下：

1）在主题区域、SCENE区域和样式区域各上传对应的图片。

2）根据需要选择是否输入提示词，之后点击“生成合并图片”。

先无提示词直出看看效果：

发现样式参考的特点没有出来，就在输入框中加入引导提示词：

3）如果想对已出图进行优化时，就点击图片左上角的优化功能或者点击生成图片进入编辑图像界面，替换或者优化提示词。

再给大家展示几组效果：

*标题“全网”指代优设网。

文章来源于互联网:全网最干喂饭教程！十个案例带你全方位玩转WHISK（中）

相关推荐: 【CV】稳定扩散模型（Stable Diffusion）

🔎大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流🔎 📝个人主页－Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞👍 + 收藏⭐️ + 留言📝 📣系列专栏 – 机器学习【ML】自然语言处理【NLP】 …

未经允许不得转载：5bei.cn大模型教程网 » 全网最干喂饭教程！十个案例带你全方位玩转WHISK（中）

标签：ai aigc Controlnet ps Stable Diffusion 复制

全网最干喂饭教程！10个案例带你全方位玩转WHISK（上）

什么是 Whisk

Whisk 的主要功能

Whisk 的生图原理

Whisk 的官网地址

Whisk 的使用要求和费用

Whisk 的实操案例

全网最干喂饭教程！10个案例带你全方位玩转WHISK（下）

案例八：一张 IP 色稿得到三视图/3D 图/场景延展图

案例九：电商产品+场景创意结合

案例十：创意视频之巨物皮卡丘睡在长城上

其他知识点补充

全网最干喂饭教程！十个案例带你全方位玩转WHISK（中）

案例四：万物皆可变冰冻/剪纸/岩彩……

案例五：文字+场景的创意

案例六：品牌 LOGO 超级符号+场景的创意

案例七：人物场景风格重绘（实景转插画）

相关推荐

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来