在亚马逊云科技上用Stable Diffusion 3.5 Large生成赛博朋克风图片（上）

文章目录 隐藏

背景介绍

在2024年的亚马逊云科技re:Invent大会上提前预告的Stable Diffusion 3.5 Large，现在已经在Amazon Bedrock上线了！各位开发者们现在可以使用该模型，根据文本提示词文生图生成高质量的图片，并且支持多种图片风格生成，助力媒体、游戏、广告和零售等行业的开发者们加速概念艺术、视觉特效以及精修产品宣传图的生成创作。

2024年10月，图像生成模型厂商Stability AI发布了Stable Diffusion 3.5 Large，这是Stable Diffusion系列中目前最强大的模型，拥有81亿个参数，值得一提的是该模型也是在Amazon SageMaker HyperPod上进行训练的，该模型可以生成极高的图像质量并具有出色的提示词匹配能力。Stable Diffusion 3.5 Large可增效开发者们在故事插画制作、概念艺术创作以及视觉特效应用的快速原型开发。大家可以快速生成高质量的高达1兆像素图片，适用于媒体营销活动、社交媒体文章插图和广告，既可以节省时间和资源，又能以上场景中的增强图像创意效果。

在本系列的上篇中，我们将介绍在亚马逊云科技控制台中，通过Stable Diffusion 3.5 Large模型生成图片的具体步骤操作，手把手带大家生成一个赛博朋克风的图片。

Stable Diffusion 3.5 Large模型的优势：

1. 多样化风格 – 该模型可以生成多种图像类别和艺术视觉效果，涵盖3D渲染、摄影、绘画、线条艺术以及几乎任何大家能想到的视觉风格。

2. 精准的提示词匹配 – Stable Diffusion 3.5 Large具备行业最先进SOTA的提示词匹配能力，能够精准按照文本提示生成图像，使其成为大家高效、高质量图片艺术创作的理想选择。

3. 多元化输出 – 无需复杂和冗长的提示词，大家即可还原我们的出花花世界，通过模型多样化的生成能力，可以轻松生成不同肤色与特征的人物形象。

除此之外，目前Amazon Bedrock上的Stable Image Ultra模型也进行了同步升级，Stable Image Ultra采用Stable Diffusion 3.5 Large作为其底层架构。Stable Image Ultra依托Stability AI最先进的模型算法（包括这次上新的Stable Diffusion 3.5），在图像生成行业里创建了全新标准，可以高效实现字体排版、复杂构图、动态光影、鲜艳色彩和艺术创作的一致性和连贯性。

借助Amazon Bedrock最新上线的Stable Diffusio 模型，大家可以获得更为丰富的图像解决方案，以提升图片创意度并赋能大家的图像生成应用。

具体步骤

1. 如果大家是首次使用Stability AI模型，大家需要登入亚马逊云科技账户进入Amazon Bedrock控制台，在左侧菜单底部选择 “Model access”（模型访问），然后在Stability AI类别中开启Stable Diffusion 3.5 Large的访问权限。

2. 在 Amazon Bedrock中开始使用Stability AI模型之前，我们要进入左侧菜单的Playgrounds模型交互界面中，选择“Image”图片生成场景。然后点击“Select model”选择模型，在分类一列中选择 Stability AI，并选择Stable Diffusion 3.5 Large模型，推理模式为“on-demand”模式。

3. 接下来大家就可以在左侧配置模型参数，在下方输入提示词来生成我们想要风格的图篇，以下是一个实例提示词：

High-energy street scene in a neon-lit Tokyo alley at night, where steam rises from food carts, and colorful neon signs illuminate the rain-slicked pavement.

“夜晚霓虹灯照亮的东京小巷，街头充满活力，蒸汽从小吃摊升起，五光十色的霓虹灯映照在湿漉漉的路面上。”

在输入提示词后，我们点击Run就可以生成图片了，下图是我们生成的一张赛博朋克风的图片样例。

以上就是亚马逊云科技上使用Stable Diffusion 3.5 Large模型生成图片的全部内容，在本篇中我们介绍了如何在亚马逊云科技的AI模型托管服务Amazon Bedrock上，通过控制台操作配置图像生成参数，生成一张赛博朋克风图片的方案。欢迎大家关注小李哥和本系列的下篇，不要错过未来更多国际前沿的AWS云开发/云架构方案。

文章来源于互联网:在亚马逊云科技上用Stable Diffusion 3.5 Large生成赛博朋克风图片（上）

背景介绍

在2024年的亚马逊云科技re:Invent大会上提前预告发布的Stable Diffusion 3.5 Large，现在已经在Amazon Bedrock上线了！各位开发者们现在可以使用该模型，根据文本提示词文生图生成高质量的图片，并且支持多种图片风格生成，助力媒体、游戏、广告和零售等行业的开发者们加速概念艺术、视觉特效以及精修产品宣传图的生成创作。

在本系列的上篇中，我们介绍了在亚马逊云科技控制台中，通过Stable Diffusion 3.5 Large模型生成图片的具体步骤操作，手把手和大家生成了一个赛博朋克风的图片。在本系列的下篇中，我们将通过API调用的方式进行图片生成，并展示Stable Diffusion 3.5 Large模型更多的图片生成场景。

如果调用Python SDK API生成图片？

下面小李哥会分享通过两种方式调用Stable Diffusion 3.5 Large生成图片。首先要介绍的是通过aws cli命令行调用图片生成的api – invoke-model。我们接下来会在命令工具中通过一条命令获取生成的图像，并将输出的JSON格式响应以标准格式输出，并使用jq工具提取编码后的图像，最后将其解码并将结果写入img.png文件，直接打开即可获取输出的图像。

以下是 AWS CLI 命令的示例：

$ aws bedrock-runtime invoke-model 
   --model-id stability.sd3-5-large-v1:0 
   --body "{"prompt":"High-energy street scene in a neon-lit Tokyo alley at night, where steam rises from food carts, and colorful neon signs illuminate the rain-slicked pavement.","mode":"text-to-image","aspect_ratio":"1:1","output_format":"jpeg","seed":0}" 
   --cli-binary-format raw-in-base64-out 
   --region us-west-2 
/dev/stdout | jq -r '.images[0]' | base64 --decode > img.jpg

如果大家希望在生成式AI应用中集成Stable Diffusion 3.5 Large模型，可以使用亚马逊云科技的SDK for Python（Boto3）。接下来我将分享调用模型生成图片的代码段，使用的模型是Stable Image Ultra 1.1（该模型的底层架构即为Stable Diffusion 3.5 Large）。下面这个代码段会在请求中添加文本到图像的提示词，并调用Amazon Bedrock生成图像，使用的模型ID为“stability.stable-image-ultra-v1:1”。

import base64
import boto3
import json
import os

MODEL_ID = "stability.stable-image-ultra-v1:1"

bedrock_runtime = boto3.client("bedrock-runtime", region_name="us-west-2")

print("Enter a prompt for the text-to-image model:")
prompt = input()

body = {
    "prompt": prompt,
    "mode": "text-to-image"
}
response = bedrock_runtime.invoke_model(modelId=MODEL_ID, body=json.dumps(body))

model_response = json.loads(response["body"].read())

base64_image_data = model_response["images"][0]

i, output_dir = 1, "output"
if not os.path.exists(output_dir):
    os.makedirs(output_dir)
while os.path.exists(os.path.join(output_dir, f"img_{i}.png")):
    i += 1

image_data = base64.b64decode(base64_image_data)

image_path = os.path.join(output_dir, f"img_{i}.png")
with open(image_path, "wb") as file:
    file.write(image_data)

print(f"The generated image has been saved to {image_path}")

该代码段生成的图像会被存储在本地文件系统的目录中，如果该目录不存在，程序会自动创建一个文件夹目录。为了避免覆盖已有的文件，代码会检查目录中是否存在同名文件，并自动将新生成的图片命名为img_.png 格式，确保文件名称的唯一性。

想要了解更多关于调用Bedrock上的模型生成内容的细节，大家可以访问Amazon Bedrock Invoke API代码示例页面，学习如何使用不同的编程语言来构建不同种类的生成式AI应用。

其他风格/场景图片生成展示

以下是使用 Stable Diffusion 3.5 Large 生成的一些其他场景的示例图片：

提示词1：生成学生正使用Amazon Bedrock的图片

Prompt: Full-body university students working on a tech project with the words Stable Diffusion 3.5 in Amazon Bedrock, cheerful cursive typography font in the foreground.

提示词2：生成三种不同颜色的药剂

Prompt: Photo of three potions: the first potion is blue with the label “MANA”, the second potion is red with the label “HEALTH”, the third potion is green with the label “POISON”. Old apothecary.

提示词3：生成玫瑰花摄影

Prompt: Photography, pink rose flowers in the twilight, glowing, tile houses in the background.

提示词4：生成旅途冒险的3D卡通画面

Prompt: 3D animation scene of an adventurer traveling the world with his pet dog.

文章来源于互联网:在亚马逊云科技上用Stable Diffusion 3.5 Large生成赛博朋克风图片（下）

在亚马逊云科技上用Stable Diffusion 3.5 Large生成赛博朋克风图片（上）

背景介绍

Stable Diffusion 3.5 Large模型的优势：

具体步骤

在亚马逊云科技上用Stable Diffusion 3.5 Large生成赛博朋克风图片（下）

背景介绍

如果调用Python SDK API生成图片？