whisper笔记
一、whisper简介 Whisper 是一种通用的自动语音识别(ASR)模型 OpenAI 开发并开源。该模型基于 68 万小时的多语言(98 种语言)和多任务的监督数据进行训练,具备多语言语音识别、语音翻译和语言识别等功能。Whispe...
一、whisper简介 Whisper 是一种通用的自动语音识别(ASR)模型 OpenAI 开发并开源。该模型基于 68 万小时的多语言(98 种语言)和多任务的监督数据进行训练,具备多语言语音识别、语音翻译和语言识别等功能。Whispe...

前言 随着生成型AI技术的能力提升,越来越多的同行开始将注意力放在了通过AI模型提升研发效率上。业内比较火的AI模型有很多,比如画图神器Midjourney、用途多样的Stable Diffusion,以及OpenAI此前刚刚迭代的DALL...

前言 介绍 SD(Stable Diffusion)中,ControlNet绝对是一个绕不开的神器!它不仅能让你生成的图片更符合预期,还能控制线条、姿势、色彩等多种细节,真正做到“所想即所得”。 今天这篇文章,一图流展示ControlNet...

在我们发布 Llama 3.1 模型群后的两个月内,包括 405B – 第一个开放的前沿级人工智能模型在内,它们所产生的影响令我们兴奋不已。 虽然这些模型非常强大,但我们也认识到,使用它们进行构建需要大量的计算资源和专业知识。 ...

本文来源公众号“江大白”,仅用于学术分享,侵权删,干货满满。 原文链接:视觉Transformer与Mamba的创新改进,完美融合(附论文及源码) 以下文章来源于微信公众号:AI视界引擎 作者:AI引擎 链接:https://mp.weix...

MetaAI 刚刚推出了 Llama-3.2,这是一套新的模型,其中包括两个令人印象深刻的轻量级大型语言模型 (LLM),分别具有 10 亿 (1B) 和 30 亿 (3B) 个参数,以及更大的视觉语言模型 (VLM),分别具有 11B 和...
1. LlamaForCausalLM类 介绍 LLama 模型采用了 Transformer 架构中的解码器结构,是一种自回归语言模型,擅长生成任务,如自然语言理解、生成、对话、以及其他与文本生成相关的任务。而 LlamaForCausa...

注意:考试链接地址:华为云鸿蒙应用入门级学习认证_华为云鸿蒙应用入门级开发者认证_华为云开发者学堂-华为云 当前认证打折之后是1元,之后原价700元,大家尽快考试!考试题库里面答案不一定全对,但是可以保证百分之九十的正确率吧!考试题目有些文...

在面向对象编程中,设计模式是一种通用的解决方案,用于解决软件设计过程中常见的问题。原型模式(Prototype Pattern)作为创建型设计模式的一员,旨在通过复制现有对象来创建新对象,而非通过常规的构造函数。这种模式不仅简化了对象的...

往期回顾: 嘉宾介绍 麦橘 MERJIC 是一位杰出的 AI 艺术家和 AIGC 领域的头部 KOL。作为 Stable Diffusion 顶尖视觉模型师,他创作了广受欢迎的麦橘 majicMIX 系列模型,该系列在国内在线运行量超过 3...