
【机器学习】FFmpeg+Whisper:二阶段法视频理解(video-to-text)大模型实战
目录 一、引言 二、FFmpeg工具介绍 2.1 什么是FFmpeg 2.2 FFmpeg核心原理 2.3 FFmpeg使用示例 三、FFmpeg+Whisper二阶段法视频理解实战 3.1 FFmpeg安装 3.2 Whisper模型下载...

目录 一、引言 二、FFmpeg工具介绍 2.1 什么是FFmpeg 2.2 FFmpeg核心原理 2.3 FFmpeg使用示例 三、FFmpeg+Whisper二阶段法视频理解实战 3.1 FFmpeg安装 3.2 Whisper模型下载...
![代码链:借助语言模型增强的代码模拟器进行推理 [译]-5bei.cn大模型教程网](https://file.5bei.cn/2024/07/frc-b3d13428b0ce2d13f3efa0c8bd71ef87-220x150.jpg)
摘要 https://chain-of-code.github.io 代码为构建复杂程序和执行精确计算提供了一种通用的语法结构。当与代码解释器 (interpreter) 配合使用时,我们推测,语言模型 (LMs) 能够通过编写代码来增强“...

今天想分享一下 Qwen 1.5 官方用例的二次封装( huggingface 说明页也有提供源码),其实没有太多的技术含量。主要是想记录一下如何从零开始在不使用第三方工具的前提下,以纯代码的方式本地部署一套大模型,相信这对于技术人员来说还...

使用 LlamaIndex 和 Llama 2-Chat 构建知识驱动的对话应用程序 从大量文本中解锁准确且富有洞察力的答案是大型语言模型 (LLM) 所实现的一项令人兴奋的功能。在构建 LLM 应用程序时,通常需要连接和查询外部数据源以为...
RAG(Retrieval-Augmented Generation)是一种结合了检索(Retrieval)和生成(Generation)的模型,用于增强大型语言模型(LLMs)的性能。召回率(Recall)是衡量RAG系统性能的关键指标之...
![能自我修复的代码是软件开发的未来 [译]-5bei.cn大模型教程网](https://file.5bei.cn/2024/07/frc-dbd69ae5ecfe3b995d47b53a7a851673-220x150.jpg)
开发者喜欢用自动化的方法来解决他们的问题,鉴于生成式 AI 的崛起,这种概念可能会在代码的创建,维护,以及改进等方面得到全新应用。 大语言模型中最引人入胜的一点是,它们能够通过自我反思来改善输出效果。将模型自身的回答反馈给它,然后让它改进回...
![FireAct:推进语言智能体的微调 [译]-5bei.cn大模型教程网](https://file.5bei.cn/2024/07/frc-0c617d3bb0eca9dcf639d01fa5e0c493-220x150.jpg)
剑桥大学、莫纳什大学和普林斯顿大学共同研究。代码、数据和模型可以在 https://fireact-agent.github.io 查看。 摘要 近期研究将语言模型与外部工具或环境结合起来,发展出能够进行推理和行动的“语言智能体”。尽管如此...
![多模态和多模态大模型 (LMM)[译]-5bei.cn大模型教程网](https://file.5bei.cn/2024/05/frc-56ead6717de7a8cc83bd70e96642e702-220x150.jpg)
以前,我们的机器学习模型一般都只处理一种类型的数据,比如只处理文本(翻译、语言建模)、图像(对象检测、图像分类)或音频(语音识别)。 但是,想想我们人类的大脑。我们不仅仅读写文字,还可以看图、看视频,听音乐,还能够辨识各种不同的声音。所以,...

大模型正在以前所未有的速度深刻改变着各行各业,其出现为创业者们带来了巨大的机遇,让行业能够重新定义和构想AI原生应用的未来。随着大模型进入产业落地期,已然达到了爆发的沸点,亟需有资金、技术实力的头部企业点燃“生态火焰”。 在此背景下,百度打...
工作岗位虽然众多,但找到真正适合自己的位置依然困难重重。 现如今,大家都特别关注 AI 研究人员的动态,就像我们关心体育联赛中的球员转会一样。这不只是简单的新闻热点和八卦传闻,从小处看,这可以预测哪些公司可能会领先或落后。往大里说,这也反映...