开源模型应用落地-语音转文本-whisper模型-AIGC应用探索(二)
一、前言 语音转文本技术具有重要价值。它能提高信息记录和处理的效率,使人们可以快速将语音内容转换为可编辑、可存储的文本形式,方便后续查阅和分析。在教育领域,可帮助学生更好地记录课堂重点;在办公场景中,能简化会议记录工作。同时,该技术...
一、前言 语音转文本技术具有重要价值。它能提高信息记录和处理的效率,使人们可以快速将语音内容转换为可编辑、可存储的文本形式,方便后续查阅和分析。在教育领域,可帮助学生更好地记录课堂重点;在办公场景中,能简化会议记录工作。同时,该技术...

图片手部修复原理 某张图片在生成后,仅有手部表现不符合预期(多指,畸形等)。这种情况下我们通常使用【局部重绘】的方式对该图片的手部进行【图生图】操作,重新绘制手部区域。 但是仅采用重绘的方式也很难保证生成的手没有问题。因此这里我们采用【co...

前言 想不想了解近期 AI 圈又发生了哪些劲爆大事件?赶紧来看这篇文章 get 第一手 AIGC 资讯和深度测评——没错,我们的AIGC 30天测评又和大家见面了。 如今各类 AIGC 工具平台百花齐放,我们的测评致力于持续追踪最新的 AI...

随着ChatGPT 和open Sora 的热度剧增,大语言模型时代,开启了AI新篇章,大语言模型的应用非常广泛,包括聊天机器人、智能客服、自动翻译、写作助手等。它们可以根据用户输入的文本生成相应的响应,提供个性化的建议和服务,目前大部分大...

AI-5bei网2024年6月14日报道丨AI资讯早报 苹果与OpenAI合作细节曝光:资源互换无付费,额外收入将分成 在本周一进行的苹果 WWDC 开发者大会上,苹果发布了「苹果智能」(Apple Intelligent)人工智能套件,并...

AI-5bei网6月14日报道丨6月13日晚间,荣耀手机发布首款小折叠手机Magic V Flip。荣耀 Magic V Flip 是荣耀首款迷你折叠屏手机。它采用了来自三星的 6.8 英寸超清大折叠屏,分辨率为 2520×108...

AI-5bei网6月14日报道丨6月12日下午,美图公司举办了以《聊聊 AI 工作流》为主题的第三届美图影像节。在发布会现场,美图展示了该公司首个 AI 视频创作能力的应用,该产品基于类 Sora 的 DiT 架构开发,并发布了一款 AI ...

😘关注公众号funNLPer畅读全文😘 技术报告:SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis 官方代码:Stability-AI-g...

一键生成毛绒绒 ICON 工作流来啦!只需要输入对应的 logo 和颜色提示词,即可生成毛绒绒效果的 ICON 图标! ㅤ 「注意事项」: 基本上所有参数都设置好,不需要大幅更改,如果觉得效果不够理想,可以从 lora 权重下手修改看看。如...
Llama大型语言模型是一种基于深度学习的自然语言处理模型,它在文本生成、问答、摘要等多种NLP任务中展现出强大的性能。本文将详细解析Llama模型的原理,包括其结构、训练过程以及工作机制,帮助读者深入理解这一先进的模型。 一、模型结构 L...