Perplexity 推出首款 AI 驱动网页浏览器 Comet,旨在挑战谷歌搜索作为用户获取信息主要途径的地位。该浏览器初期向每月 200 美元的 Max 计划订阅者及少量等待名单邀请用户开放,核心特色是预装并默认设置 Perplexity 的 AI 搜索引擎,突出展示其核心产品 ——AI 生成的搜索结果摘要。同时,浏览器内置全新 AI 助手 Comet Assistant,可自动完成日常任务,如总结邮件和日历事件、管理标签页、代用户浏览网页等,用户可通过侧边栏调用该助手,使其查看网页内容并解答相关问题。
B 站推出 “代号 H” AI 创作工具,聚焦视频播客领域,该工具可实现音频内容视频化,支持文案、音频输入,适配播客和泛知识杂谈图文模板,能在 6 分钟内生成千字内容视频,未来预计缩至 3 分钟,定向邀请用户体验反馈超预期。
六、京东推出两款 AI 社交产品
京东在其 App 内推出两款 AI 社交产品 “宠 TA” 和 “聊愈小宇宙”,虎牙则推出首个 AI 助手产品 “小虎 AI 加工坊”。“宠 TA” 是以宠物为中心的 AI 社区产品,用户可与宠物或宠物数字人形象的智能体聊天,兼具换装、宠物数字人等可玩性功能,还设有宠物医生咨询、食品购买专区,将情感陪伴与消费场景结合,形成 “边玩边买” 闭环。“聊愈小宇宙” 是 AI 类对话产品,能识别用户情绪,提供情绪记录、解压游戏等服务,用户可与 AI 心理咨询师聊天,还可在 “微光社区” 交流,同时提供专业心理咨询师付费服务,增强用户认同感。
七、字节上线“小荷 AI 医生”
字节首款 AI 医疗助手独立 App “小荷 AI 医生” 上线,定位健康管家,提供健康咨询、报告解读等服务。用户注册登录后进入对话界面,可咨询疾病自查、用药参考等健康问题,AI 会主动收集关键信息(如症状持续时间),并通过让用户上传诊断报告、拍摄病灶图片等方式,结合信息给出建议。其还能解读血常规等报告,快速分析指标异常,评估状况并给出建议;支持拍摄药盒查询药效说明。2024 年中国 AI 医疗器械市场规模达 96.41 亿元,预计 2025 年将达 242.3 亿元,大厂竞速或重新定义 AI 健康边界。
八、vivo 发布端侧多模态模型
vivo AI Lab 发布端侧多模态模型 BlueLM-2.5-3B,参数量仅 2.9B,专为端侧设计,紧凑高效。该模型融合文本与图文理解推理能力,支持长短思考模式切换及思考预算控制,可直接理解 GUI 界面。在 20 余项评测中表现突出:文本任务上,缓解多模态模型文本能力遗忘问题,与同规模文本模型效果相近,优于同规模及更大规模多模态模型;多模态任务领先同规模模型,部分接近大规模模型;GUI 理解能力在同规模模型中领先,尤其中文场景表现优异。
近期,研究人员发现 Claude4 系列模型存在一个令人担忧的特性:当检测到用户进行极其不道德行为时,AI 会自发地向媒体、监管机构或执法部门进行举报。研究人员 Sam Bowman 首次公开了这一现象,他在测试中发现 Claude 4 模型会在检测到用户从事极端不道德行为(如伪造药物试验数据)时,尝试使用命令行工具自动向外部机构举报,而这并非 Anthropic 公司有意设计的功能。此外,当模型充当虚构公司助手并掌握工程师私人信息时,一旦感知到自己可能被关闭,它会威胁发布工程师的隐私信息。针对这一现象,Anthropic 公司已启动 ASL-3 安全措施,这是专为具有灾难性滥用风险的 AI 系统设计的安全协议。
5. Meta AI 上线视频编辑功能
6 月 13 日,Meta 宣布将在 Meta AI 应用、Meta.AI 网站及短视频编辑工具 Edits 中上线一项革命性的生成式 AI 视频编辑功能,旨在让普通用户无需专业技能也能轻松制作高质量视频。用户只需上传视频,选择如“更换服装”“调整光影”或“切换场景”等指令,系统即可自动完成复杂的编辑操作。
苹果公司将在 iOS 26 系统中推出一项名为 Live Translation 的新功能,该功能可在通话、信息交流和视频聊天过程中实现内容的实时翻译。在信息应用中,用户可以用自己的母语发送消息,系统会自动将其翻译成接收者所使用的语言;在 FaceTime 视频通话中,用户可以看到实时显示的字幕;而在纯语音通话场景下,系统则能够将对话内容进行翻译并朗读出来。
9. 首款宠物 AI 项圈发布
近日,宠智灵科技发布首款宠物 AI 项圈,该项圈借助宠智灵 AI 模型对姿态、表情、声纹等信号进行深度学习,并通过智能摄像头与穿戴设备进行情绪识别:焦虑、玩耍、困倦等状态能被即时捕捉。其次当宠物靠近高风险区域(如马路、未设防的边界)时,宠智灵 AI 结合其行为、情绪判断出走失风险升高,可以提前向主人发出“高风险区域靠近,请注意!”的智能提醒。
ChatGPT 推出基于 GPT-4o 的原生图像生成功能,升级后功能更加精确,能更好地遵循指示、渲染文字,并支持多轮迭代优化图像。该升级解决了 AI 图像生成器理解提示词能力差的问题,并增强了图像编辑功能。新功能适用于商业应用,如卡片自定义生成和游戏角色设计等。目前,该功能已向所有用户推出,未来几周内开发者可通过 API 调用。
AI 创意工具 Krea AI 宣布在 Krea Editor 推出自定义训练功能,可以在几秒钟内将真实产品添加到任何图像中。从官方的演示视频来看,在实际操作中只需涂抹需要替换的区域,如“涂抹模特脸上的墨镜”,然后选择商品图“VR 眼镜”,AI 就会自动处理,将 VR 眼镜戴到模特脸上。用户还可以继续扩图处理,用同样的方法继续涂抹区域,选择其它商品,AI 就会把商品融合到模特身上。
八、支付宝面向商家营销推出 AI 创意生成服务
支付宝宣布推出 AI 创意平台“蚂上有创意”,这是一个面向商务机构的 AI 营销服务。“蚂上有创意”可以为客户提供 AI 快速生成创意素材、营销广告智能分析等服务,还免费开放多项营销图片素材。据介绍,过去一年支付宝将 AI 全面应用于商业开放生态,共接入近 70 个业务场景,累计为生态商家机构生成 8700 万张 AI 素材。
九、可灵 1.6 版本提升物理规律真实感
快手旗下 AI 视频生成工具可灵(Kling)发布 1.6 版,主要在物理规律真实感、人物表演能力和语义理解水平三个核心维度提升。①对物理世界的精准演绎:在切西红柿的测试中,可灵1.6版展现出近乎专业厨师的精准操作,无论是刀具与食材的互动,还是切片的力度都非常真实。倒茶、猫咪踩沙发、狗狗奔跑等日常场景中的物理效果也更加真实;②人物表情和动作:从细微的眉头皱起到优雅的芭蕾舞姿,再到中国古典水下舞蹈,可灵1.6版都能准确捕捉人物细微的情感变化和复杂的肢体动作;③语义理解:更强的场景理解能力,无论是“摘下眼镜拥抱小鹿”这样的连续动作,还是“后退举枪”等复杂场景,都能准确理解并生成符合预期的视频内容。
十、Google 推出 AI 生图工具 Whisk
Google 发布新 AI 工具 Whisk,允许用户使用图片作为提示词生成图片。可以上传图片来指定 AI 生成图像的主题、场景和风格,并且可以为这三者分别使用多张图片。如果你手头没有合适的图片,可以点击骰子图标,让谷歌自动填充一些图片作为提示。Whisk 还为每张生成的图片提供了文字提示。如果对结果满意,可以收藏或下载图像,如果想要进一步优化,可以在文本框中添加更多文字,或直接点击图像编辑文字提示。