成功率

陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年

数学为评估复杂推理提供了一个独特而合适的测试平台。 它需要一定的创造力和精确的逻辑链条——通常涉及复杂的证明,这些证明必须缜密地筹划和执行。 同时,数学还允许对结果进行客观验证。

新成绩!毫末用户智驾里程突破2亿公里

在自动驾驶技术的快速发展浪潮中,毫末智行再次迎来新成绩。8月14日,毫末智行宣布其用户智能驾驶行驶里程突破2亿公里大关,这一成绩不仅是毫末技术实力的迈进,也标志着毫末数据闭环能力的迈上新台阶。在自动驾驶技术的研发与量产落地方面,毫末智行始终走在行业前列。经过四年多的发展,毫末乘用车智能驾驶产品HPilot搭载车辆超过20款,毫末用户智能驾驶行驶里程已达2亿公里,是中国量产自动驾驶领军者。目前,搭载毫末HPilot的乘用车已广泛行驶于中国数百个城市,为用户带来安全、便捷、智能的出行体验。截至目前,毫末已推出三代七款智

提示词用上“过去式”,秒破 GPT-4o 等六大模型安全限制:中文语境也好使

只要在提示词中把时间设定成过去,就能轻松突破大模型的安全防线。而且对 GPT-4o 尤其有效,原本只有 1% 的攻击成功率直接飙到 88%,几乎是“有求必应”。有网友看了后直言,这简直是有史以来最简单的大模型越狱方式。来自洛桑联邦理工学院的一篇最新论文,揭开了这个大模型安全措施的新漏洞。而且攻击方式简单到离谱,不用像“奶奶漏洞”那样专门构建特殊情境,更不必说专业对抗性攻击里那些意义不明的特殊符号了。只要把请求中的时间改成过去,就能让 GPT-4o 把燃烧弹和毒品的配方和盘托出。而且量子位实测发现,把提示词改成中文,
  • 1