成功率 - AI在线

陶哲轩联手60多位数学家出题，世界顶尖模型通过率仅2%！专家级数学基准，让AI再苦战数年

数学为评估复杂推理提供了一个独特而合适的测试平台。它需要一定的创造力和精确的逻辑链条——通常涉及复杂的证明，这些证明必须缜密地筹划和执行。同时，数学还允许对结果进行客观验证。

新成绩！毫末用户智驾里程突破2亿公里

在自动驾驶技术的快速发展浪潮中，毫末智行再次迎来新成绩。8月14日，毫末智行宣布其用户智能驾驶行驶里程突破2亿公里大关，这一成绩不仅是毫末技术实力的迈进，也标志着毫末数据闭环能力的迈上新台阶。在自动驾驶技术的研发与量产落地方面，毫末智行始终走在行业前列。经过四年多的发展，毫末乘用车智能驾驶产品HPilot搭载车辆超过20款，毫末用户智能驾驶行驶里程已达2亿公里，是中国量产自动驾驶领军者。目前，搭载毫末HPilot的乘用车已广泛行驶于中国数百个城市，为用户带来安全、便捷、智能的出行体验。截至目前，毫末已推出三代七款智

提示词用上“过去式”，秒破 GPT-4o 等六大模型安全限制：中文语境也好使

只要在提示词中把时间设定成过去，就能轻松突破大模型的安全防线。而且对 GPT-4o 尤其有效，原本只有 1% 的攻击成功率直接飙到 88%，几乎是“有求必应”。有网友看了后直言，这简直是有史以来最简单的大模型越狱方式。来自洛桑联邦理工学院的一篇最新论文，揭开了这个大模型安全措施的新漏洞。而且攻击方式简单到离谱，不用像“奶奶漏洞”那样专门构建特殊情境，更不必说专业对抗性攻击里那些意义不明的特殊符号了。只要把请求中的时间改成过去，就能让 GPT-4o 把燃烧弹和毒品的配方和盘托出。而且量子位实测发现，把提示词改成中文，