标签：mlp

第4页

AI创作

AIGC利器：Flux模型代码基础学习

2025-02-23EmberGlimmer阅读(630)赞(0)

模型链接：black-forest-labs/FLUX.1-dev – Hugging Face 1：模型整体配置： { “_class_name”: “FluxPipeline̶...

AI创作

Stable Diffusion 3 论文

2025-02-16EmberHeart阅读(781)赞(0)

Stable Diffusion 3 论文摘要本周主要阅读了Stable Diffusion 3（SD3）的核心论文《Scaling Rectified Flow Transformers for High-Resolution Ima...

AI创作

体验 Whisper ，本地离线部署自己的 ASR 语音识别服务

2025-02-07EnigmaticGaze阅读(3059)赞(0)

需求背景最近看视频，过几天后经常忘记内容，所以有了把重点内容总结提炼到自己知识库的需求，这涉及到了提取视频中的音频数据、离线语音识别等功能。提取视频中的音频数据，可以使用格式工厂或 FFmpeg 等工具， FFmpeg 可以使用命令 f...

AI创作

利用 FP8 量化加速 Llama-3-70B 推理

2025-02-05LunarEclipse阅读(998)赞(0)

本文针对在 Amazon P5 (H100 GPU) 上部署 Llama-3-70b FP8 精度模型的两种方案选型（Trion 及 LMI – Large Model Inference 容器）进行了探索，同时提供了基于 FMBench ...

AI创作

智创 AI 新视界 -- 探秘 AIGC 中的生成对抗网络（GAN）应用

2025-01-31LunarFrost阅读(629)赞(0)

💖💖💖亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅...

AI创作

Stable Diffusion核心网络结构——CLIP Text Encoder

2025-01-29ai_helper阅读(897)赞(0)

🌺系列文章推荐🌺 扩散模型系列文章正在持续的更新，更新节奏如下，先更新SD模型讲解，再更新相关的微调方法文章，敬请期待！！！（本文及其之前的文章均已更新） SD模型原理： Stable Diffusion概要讲解 Stable diffu...

AI创作

用TensorRT-LLM进行LLama的推理和部署

2025-01-25LunarEclipse阅读(704)赞(0)

Deploy an AI Coding Assistant with NVIDIA TensorRT-LLM and NVIDIA Triton | NVIDIA Technical BlogQuick Start Guide — tens...

AI创作

视频多模态模型: VideoChat、Video-LLaMA、Video-ChatGPT、Video-LLaVA等

2025-01-22FrozenEmbers阅读(306)赞(0)

VideoChat VideoChat🦜: 基于视频指令数据微调的聊天机器人 https://arxiv.org/pdf/2305.06355.pdf https://github.com/OpenGVLab/Ask-Anything/tr...

AI创作

大模型笔记！以LLAMA为例，快速入门LLM的推理过程

2025-01-21LunarEclipse阅读(268)赞(0)

本文借助llama这个模型快速入门LLM的推理过程，很多技术细节都是通用的，也适合其他的LLM。这篇文章之前发过一次，现在整理下内容重新发下。这篇也算是总结的性质，仅需要的知识点都列出来，简单介绍一番。可能说的不够详细，想看具体细节的小伙...

AI创作

腾讯HunyuanDit代码解析

2025-01-20CosmicWanderer阅读(336)赞(0)

注意：本文仅供自己记录学习过程使用。训练全参训练过程输入图像用VAE编码得到输入的x_start(1,4,128,128)；文本的两个特征：bert的encoder feature(1,77,1024)和T5 的feature(1,2...

上一页
1
2
3
4
5
6
7
...
下一页
共 9 页

标签：mlp

AIGC利器：Flux模型代码基础学习

Stable Diffusion 3 论文

体验 Whisper ，本地离线部署自己的 ASR 语音识别服务

利用 FP8 量化加速 Llama-3-70B 推理

智创 AI 新视界 -- 探秘 AIGC 中的生成对抗网络（GAN）应用

Stable Diffusion核心网络结构——CLIP Text Encoder

用TensorRT-LLM进行LLama的推理和部署

视频多模态模型: VideoChat、Video-LLaMA、Video-ChatGPT、Video-LLaVA等

大模型笔记！以LLAMA为例，快速入门LLM的推理过程

腾讯HunyuanDit代码解析

对比kimi、通义千问、文心一言的写代码能力

热门文章

AI大模型,我们的未来