
OpenAI 开源的免费 AI 语音转文字工具 - Whisper,一步一步本地部署运行
Whisper 是 OpenAI 研发的一个通用的语音识别模型,可以把语音转为文本。它在大量多样化的音频数据集上进行训练,同时还是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 一、使用场景 语音 => 文字 是一个非常...

Whisper 是 OpenAI 研发的一个通用的语音识别模型,可以把语音转为文本。它在大量多样化的音频数据集上进行训练,同时还是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 一、使用场景 语音 => 文字 是一个非常...

姚明(Yao Ming),男,汉族,无党派人士,1980年9月12日出生于上海市徐汇区,祖籍江苏省苏州市吴江区震泽镇,前中国职业篮球运动员,司职中锋,现任亚洲篮球联合会主席、中国篮球协会主席、中职联公司董事长兼总经理,十三届全国青联副主席,...

大家好,我是画画的小强 在之前文章中我已经介绍了AI绘画Stable Diffusion 的各种入门使用,从今天开始正式进入SD ControlNet系列文章介绍,感谢大家的持续支持和鼓励,不管如何,要想掌握一门技术,最重要的事是:多练习!...
Transformer模型相对复杂,下面我将提供一个简化版的Transformer模型的Python代码示例,使用PyTorch库实现。这个示例将包括模型的基本结构,如编码器和解码器,自注意力机制,位置编码,以及前馈网络。 请注意,这个示例...

0 背景 生成式人工智能AIGC(Artificial Intelligence Generated Content)是人工智能1.0时代进入2.0时代的重要标志。 AIGC对于人类社会、人工智能的意义是里程碑式的。短期来看AIGC改变了基...

使用sd做艺术字时,发现字体对结果有很大的影响。具体的配置参数写在了最后面,配置主要参考了博主天一寨主的博客:Stable diffusion做创意字体设计,泰裤辣(附教程) – 知乎。 如果使用的字体直线多、棱角分明,生成的图...
1. 模型的微调 1.1 大模型LLaMa下载 先下载一个完整版本的LLaMa模型,官网的或别人下载微调过的中文版本的。 1.2 指令微调 执行run_clm_sft_with_peft 1.3 合并LORA 大模型的原始参数和微调后的参数...

大家好,我是风雨无阻。 本期内容: Embedding是什么? Embedding有什么作用? Embedding如何下载安装? 如何使用Embedding? 大家还记得 AI 绘画Stable Diffusion 研究(七) 一文读懂 S...

核心 和diffusion相比,使用了latent(隐式空间)做diffusion,这样速度更快!!! SD模型的主体结构如下图所示,主要包括三个模型: autoencoder:encoder将图像压缩到latent空间,而decoder将...

大家好,这里和你们一起探索 AI 的花生。 今天继续我们的 AI 效率神器推荐第 9 期,一起来看看吧~ 上期回顾: 一、FreePik AI 图像处理 网站直达:https://www.freepik.com/pikaso/expand ...