OpenAI o1推理能力极限测试丨大模型的推理能力究竟有多脆弱?
就在一个月前,OpenAI悄悄发布了o1.o1的推理能力是有目共睹的。 我当时用了几个很难很难的测试样例去试验了一下,很多模型见了都会犯怵,开始胡说八道。 最难的其中一个是姜萍奥赛的那个数学题,几乎暴揍所有大模型的那个题,交给o1.o1竟然...
就在一个月前,OpenAI悄悄发布了o1.o1的推理能力是有目共睹的。 我当时用了几个很难很难的测试样例去试验了一下,很多模型见了都会犯怵,开始胡说八道。 最难的其中一个是姜萍奥赛的那个数学题,几乎暴揍所有大模型的那个题,交给o1.o1竟然...
AI-5bei网2024年10月14日报道丨AI资讯早报 马斯克主持的特斯拉机器人发布会,“擎天柱”背后有人远程操控 当地时间的上周四,特斯拉 CEO 马斯克在洛杉矶主持召开的 Robotaxi 自动驾驶出租车发布会活动上,公开向媒体们展示...
2024年,被媒体称为“AI应用元年”。 作为国内最具影响力的软件下载站之一,华军软件园于8月上线【华军AI产品榜】,将持续打造国内AI产品权威榜单。 综合统计9月周期的AI产品运营数据,我们正式对外发布第二期榜单。 🔗 查看完整榜单: h...
Kimi上线探索版,单次精度500页 通用人工智能创业公司——月之暗面当日正式发布可自主海量搜索解决复杂问题的Kimi探索版。Kimi 探索版具备AI自主搜索能力,可以模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结...
AI-5bei网2024年10月11日报道丨AI资讯早报 AMD发布新一代AI芯片MI325X,旨在与英伟达Blackwell竞争 当地时间10月10日,AMD在旧金山举行一场针对人工智能芯片的新品发布会——AMD Advancing AI...
昨天晚上打开Kimi,想用它帮我朋友写个东西。 突然发现,他们上新功能了。 得,又不让我睡觉了。。。 真的,我不知道你们有没有发现。之前动静最大,没事就能掀起AI圈山呼海啸的Kimi,自从7月上了个浏览器插件、上了个AIPPT之后,突然“人...
在智能手机之后,下一代的硬件范式应该长什么样,答案仍是众说纷纭,但有一个共识已经越来越清晰—— 下一代硬件,应该是 AI 硬件。 全球热销 200 万台的 Meta Ray-Ban 智能眼镜和已经不足 5000 人使用的 Rabbit R1...
AI-5bei网2024年10月10日报道丨AI资讯早报 AI杀疯了!2024诺贝尔化学奖授予谷歌DeepMind CEO 当地时间 10 月 9 日,瑞典皇家科学院宣布,将 2024 年诺贝尔化学奖授予三位科学家,来自谷歌系的DeepMi...
9 月 29 日消息,一项新研究发现,随着大语言模型变得越来越强大,它们似乎也越来越容易编造事实,而不是避免或拒绝回答它们无法回答的问题。这表明,这些更聪明的 AI 聊天机器人实际上变得不太可靠。 这项研究发表在《自然》杂志上,研究人员研究...
AI-5bei网2024年10月8日报道丨AI资讯早报 OpenAI发文宣布融资66亿美元,估值超过1500亿美元 OpenAI,生成式AI行业的领头羊企业,缔造了硅谷创投圈的融资金额记录。 当地时间10月2日,OpenAI发文宣布,获得了...