
阿里开源语音大模型CosyVoice:3秒还原声音,从部署到克隆的完整指南
前言 很久之前就想给大家介绍声音克隆开源项目GPT-SoVITS ,但是看到视频教程过于复杂了,最近又出现了一个剪辑《人民的名义》的短视频非常搞笑。 我就找到了一款最新更加强大的声音克隆项目CosyVoice。CosyVoice 是阿里通义...

前言 很久之前就想给大家介绍声音克隆开源项目GPT-SoVITS ,但是看到视频教程过于复杂了,最近又出现了一个剪辑《人民的名义》的短视频非常搞笑。 我就找到了一款最新更加强大的声音克隆项目CosyVoice。CosyVoice 是阿里通义...

Deforum 与 AnimateDiff 不太一样, AnimateDiff 是生成丝滑变化视频的,而 Deforum 的丝滑程度远远没有 AnimateDiff 好。 它是根据对比前面一帧的画面,然后不断生成新的相似图片,来组合成一个完...

Meta AI最近发布了 Llama 3.2。这是他们第一次推出可以同时处理文字和图片的多模态模型。这个版本主要关注两个方面: 视觉功能:他们现在有了能处理图片的模型,参数量从11亿到90亿不等。 轻量级模型:这些模型参数量在1亿到3亿之间...

昨天给大家分享了:如何在手机端用 Ollama 跑大模型 有小伙伴问:为啥要选择 Ollama? 不用 Ollama,还能用啥?据猴哥所知,当前大模型加速的主流工具有:Ollama、vLLM、llama.cpp 等。 那我到底该用哪个呢? ...

Deploy an AI Coding Assistant with NVIDIA TensorRT-LLM and NVIDIA Triton | NVIDIA Technical BlogQuick Start Guide — tens...

前言 工欲善其事,必先利其器!今天我们聊聊 Stable Diffusion WebUI 的基础操作以及各个参数都代表了什么。 还没有安装 SD的小伙伴,移步我前面的文章:超详细的 Stable Diffusion Webui入门教程 快速...

最近有朋友需要人像素材,让我画了一些。如果没有特别要求,普通人像还是比较容易出,但也有一些基础技巧。今天就来简单分享一下。 提示:熟手略过。国际惯例,先出例图。 分享四点基础经验,最后一个更重要些。 一、画布大小 SD默认出...

“ AI魔法擦 ” 在生成图像时总有一些不完美的小瑕疵,比如多余的物体或碍眼的水印,它们破坏了图片的美感。但别担心,今天我们将介绍一款神奇的工具——sd- webui-cleaner,它可以帮助我们使用Stable Diffusion轻松去...
stable-diffusion.cpp: 纯C/C++实现的高性能AI图像生成引擎 stable-diffusion.cpp是一个令人印象深刻的开源项目,它用纯C/C++实现了Stable Diffusion和Flux等先进的AI图像生成...

当下,AIGC 已从舆论热点迈向实用领域,在设计范畴内,其应用多集中于具象内容改编,如人像绘制、插画创作等。IP 形象打造更是其中的焦点与通用方向。 更多干货: 一、IP 打造 从无到有 今年,我们团队大胆尝试将 AIGC 技术应用于 IP...