
Fastwhisper + Pyannote 实现 ASR + 说话者识别
前言 最近在研究ASR相关的业务,也是调研了不少模型,踩了不少坑,ASR这块,目前中文普通话效果最好的应该是阿里的modelscope上的中文模型了,英文的话,还是非whisper莫属了,而且whisper很变态,粤语效果也还不错,因此,如...

前言 最近在研究ASR相关的业务,也是调研了不少模型,踩了不少坑,ASR这块,目前中文普通话效果最好的应该是阿里的modelscope上的中文模型了,英文的话,还是非whisper莫属了,而且whisper很变态,粤语效果也还不错,因此,如...

0. 环境搭建 0.1 Windows 0.1.1 git环境安装 去下方网站获取git的win安装包,之后不断点击下一步就可以了: https://git-scm.com/ 安装完之后,运行Win+R唤出控制台,执行如下命令检验是否安装完...
今天一早,谷歌CEO劈柴在X上发布帖子,宣告NeuralGCM在气候建模领域取得了重大突破! 「NeuralGCM将基于物理的建模与人工智能相结合,在模拟大气方面的效率比其他模型高出10万倍,为科学家提供了预测气候变化的新工具。」 这项研究...

‘’ LLama Factory,这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程,并且易于访问,使用体验友好。此外,它还提供了由 Hiyouga 提供的 Hugging Face...

为什么要用LLaMa-Factory 如果你尝试过微调大模型,你就会知道,大模型的环境配置是非常繁琐的,需要安装大量的第三方库和依赖,甚至需要接入一些框架。 但是大模型微调的方法又是非常类似的,那有没有一种工具可以统一这些操作,让大模型微调...

目录 ComfyUI的特性介绍 开始安装 做点准备工作 在Conda虚拟环境中进行 依赖项的安装 运行 政安晨的个人主页:政安晨 欢迎 👍点赞✍评论⭐收藏 收录专栏: 零基础玩转各类开源AI项目 希望政安晨的博客能够对您有所裨益,如有不足之...

简介 这两天玩了一下stable diffusion,是真的好玩! 然后我在想遥感有没有相关的生成模型,找了一下,还真找到了(https://github.com/xiaoyuan1996/Stable-Diffusion-for-Remo...

大家好,这里是和你们一起探索 AI 的花生~ Controlnet 可以说是目前最重要的一款 AI 绘画控制插件,可以帮我们实现轮廓、深度、动作姿势、颜色等多种控制效果。由于每种控制条件都需要调用不同的控制模型,加上 SD1.5 和 SDX...

#记录工作,工作复盘 仅作记录,未尽之处请补充,谢谢! 电脑配置情况大致记录如下,请参考: MSI移动工作站,64G内存,4GB显存 一、安装前准备: 阅读文档,明确软件依赖和安装要求: 在用Anaconda环境下安装stable-diff...

大家好,这里是和你们一起探索 AI 的花生~ Controlnet、SD WebUI Forge 和 LayerDiffusion 的作者 lllyasviel 大神最近又推出了一个新的项目 IC-Light,可以实现控制一张图像的光照方向...