
AIGC利器:Flux模型代码基础学习
模型链接:black-forest-labs/FLUX.1-dev – Hugging Face 1:模型整体配置: { “_class_name”: “FluxPipeline̶...

模型链接:black-forest-labs/FLUX.1-dev – Hugging Face 1:模型整体配置: { “_class_name”: “FluxPipeline̶...

Stable Diffusion 3 论文 摘要 本周主要阅读了Stable Diffusion 3(SD3)的核心论文《Scaling Rectified Flow Transformers for High-Resolution Ima...

需求背景 最近看视频,过几天后经常忘记内容,所以有了把重点内容总结提炼到自己知识库的需求,这涉及到了提取视频中的音频数据、离线语音识别等功能。 提取视频中的音频数据,可以使用格式工厂或 FFmpeg 等工具, FFmpeg 可以使用命令 f...

本文针对在 Amazon P5 (H100 GPU) 上部署 Llama-3-70b FP8 精度模型的两种方案选型(Trion 及 LMI – Large Model Inference 容器)进行了探索,同时提供了基于 FMBench ...

💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的博客,正是这样一个温暖美好的所在。在这里,你们不仅...

🌺系列文章推荐🌺 扩散模型系列文章正在持续的更新,更新节奏如下,先更新SD模型讲解,再更新相关的微调方法文章,敬请期待!!!(本文及其之前的文章均已更新) SD模型原理: Stable Diffusion概要讲解 Stable diffu...

Deploy an AI Coding Assistant with NVIDIA TensorRT-LLM and NVIDIA Triton | NVIDIA Technical BlogQuick Start Guide — tens...

VideoChat VideoChat🦜: 基于视频指令数据微调的聊天机器人 https://arxiv.org/pdf/2305.06355.pdf https://github.com/OpenGVLab/Ask-Anything/tr...

本文借助llama这个模型快速入门LLM的推理过程,很多技术细节都是通用的,也适合其他的LLM。这篇文章之前发过一次,现在整理下内容重新发下。 这篇也算是总结的性质,仅需要的知识点都列出来,简单介绍一番。可能说的不够详细,想看具体细节的小伙...

注意:本文仅供自己记录学习过程使用。 训练 全参训练过程 输入图像用VAE编码得到输入的x_start(1,4,128,128);文本的两个特征:bert的encoder feature(1,77,1024)和T5 的feature(1,2...