AI创作

阿里开源语音大模型CosyVoice：3秒还原声音，从部署到克隆的完整指南

2025-01-25EnchantedScribe阅读(1337)赞(0)

前言很久之前就想给大家介绍声音克隆开源项目GPT-SoVITS ，但是看到视频教程过于复杂了，最近又出现了一个剪辑《人民的名义》的短视频非常搞笑。我就找到了一款最新更加强大的声音克隆项目CosyVoice。CosyVoice 是阿里通义...

2025-01-25CrimsonArrow阅读(657)赞(0)

Deforum 与 AnimateDiff 不太一样， AnimateDiff 是生成丝滑变化视频的，而 Deforum 的丝滑程度远远没有 AnimateDiff 好。它是根据对比前面一帧的画面，然后不断生成新的相似图片，来组合成一个完...

2025-01-25FrozenEmbers阅读(531)赞(0)

Meta AI最近发布了 Llama 3.2。这是他们第一次推出可以同时处理文字和图片的多模态模型。这个版本主要关注两个方面：视觉功能：他们现在有了能处理图片的模型，参数量从11亿到90亿不等。轻量级模型：这些模型参数量在1亿到3亿之间...

2025-01-25EnchantedScribe阅读(1063)赞(0)

昨天给大家分享了：如何在手机端用 Ollama 跑大模型有小伙伴问：为啥要选择 Ollama？不用 Ollama，还能用啥？据猴哥所知，当前大模型加速的主流工具有：Ollama、vLLM、llama.cpp 等。那我到底该用哪个呢？ ...

2025-01-25LunarEclipse阅读(778)赞(0)

Deploy an AI Coding Assistant with NVIDIA TensorRT-LLM and NVIDIA Triton | NVIDIA Technical BlogQuick Start Guide — tens...

2025-01-25CrimsonArrow阅读(1003)赞(0)

前言工欲善其事，必先利其器！今天我们聊聊 Stable Diffusion WebUI 的基础操作以及各个参数都代表了什么。还没有安装 SD的小伙伴，移步我前面的文章：超详细的 Stable Diffusion Webui入门教程快速...

2025-01-25CrimsonArrow阅读(421)赞(0)

最近有朋友需要人像素材，让我画了一些。如果没有特别要求，普通人像还是比较容易出，但也有一些基础技巧。今天就来简单分享一下。提示：熟手略过。国际惯例，先出例图。分享四点基础经验，最后一个更重要些。一、画布大小 SD默认出...

2025-01-25CrimsonArrow阅读(575)赞(0)

“ AI魔法擦 ” 在生成图像时总有一些不完美的小瑕疵，比如多余的物体或碍眼的水印，它们破坏了图片的美感。但别担心，今天我们将介绍一款神奇的工具——sd- webui-cleaner，它可以帮助我们使用Stable Diffusion轻松去...

2025-01-25ElectricStorm阅读(680)赞(0)

stable-diffusion.cpp: 纯C/C++实现的高性能AI图像生成引擎 stable-diffusion.cpp是一个令人印象深刻的开源项目,它用纯C/C++实现了Stable Diffusion和Flux等先进的AI图像生成...

2025-01-25h_openai阅读(647)赞(0)

当下，AIGC 已从舆论热点迈向实用领域，在设计范畴内，其应用多集中于具象内容改编，如人像绘制、插画创作等。IP 形象打造更是其中的焦点与通用方向。更多干货：一、IP 打造从无到有今年，我们团队大胆尝试将 AIGC 技术应用于 IP...