应用
斯坦福揭秘 o1-preview 软肋:数学竞赛题稍作修改,准确率骤降 30%
斯坦福大学最近的一项研究发现,尽管 o1-preview 在数学、代码等领域能力逆天,但只要对数学竞赛的题目稍修改,模型解答的准确率竟会立刻下降 30%。
英特尔 Falcon Shores GPU 止步,战略转向 AI 系统级解决方案
科技媒体 TechCrunch 昨日(1 月 30 日)发布博文,报道称英特尔正式放弃下一代高性能计算和人工智能 GPU——Falcon Shores。
突破瓶颈,百度 EICopilot AI 提升企业知识图谱利用率
百度于 2025 年 1 月 23 日公布最新研究成果 EICopilot,利用大型语言模型(LLM)简化了从数据库中提取信息的流程,为企业知识图谱探索提供了高效解决方案。
消息称 OpenAI 新一轮融资至多 400 亿美元,估值将达到 3000 亿美元
据华尔街日报报道,OpenAI 正在就新一轮融资进行谈判,拟筹资金额高达 400 亿美元。对这家 ChatGPT 制造商的估值将达到 3000 亿美元,日本软银集团可能会在本轮融资中领投。
AI 诈骗升级,全球 25 亿谷歌 Gmail 用户面临新威胁
攻击者利用 AI 技术模拟真人语音,伪装成 Google 美国客服人员,并使用带有 Google 来电显示的号码联系受害者。
OpenAI o1 推理模型免费用,微软 Copilot 开放“深度思考”AI 功能
Microsoft AI 公司首席执行官穆斯塔法・苏莱曼(Mustafa Suleyman)昨日(1 月 30 日)在 X 平台发布推文,宣布所有 Microsoft Copilot 用户现在都可以免费使用 OpenAI 的 o1 推理模型。
英伟达:DeepSeek-R1 模型现已上线 NIM 微服务平台
英伟达今日宣布,DeepSeek-R1 模型现已在 build.nvidia.com 上作为 NVIDIA NIM 微服务预览版提供。DeepSeek-R1 NIM 微服务可以在单个 NVIDIA HGX H200 系统上每秒提供多达 3,872 tokens。
不用开口:谷歌 AI 帮你致电商家,价格、预约一键搞定
谷歌公司昨日(1 月 30 日)发布公告,在 Search Labs 中推出名为“Ask for Me”的实验性新功能,用户可以利用 AI 代替自己致电商家,咨询价格和服务可用性等信息。
Aurora 超级计算机向全球科学界开放,模拟计算能力超 1 FP64 ExaFLOPS
Aurora早在2015年就已公布,但因多次延迟才终于完成。现在,它能够提供超过1 FP64 ExaFLOPS的模拟计算能力,并能为人工智能和机器学习提供11.6混合精度ExaFLOPS的性能。
AI 生成内容泛滥,美国最大作家组织推出“人类创作”书籍认证
该项目被称为“人类创作”(Human Authored)认证,旨在帮助作家在AI日益充斥的市场中让自己的作品脱颖而出,并确保读者知道他们阅读的书籍是由谁(或什么)创作的。
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈
一线 AI 洞察,智者深度思考 深入产业变革,共创 AI 未来2025 年伊始,全球 AI 业界被 DeepSeek 刷屏。 当 OpenAI 宣布 5000 亿美元的「星际之门」计划,Meta 在建规模超 130 万 GPU 的数据中心时,这个来自中国的团队打破了大模型军备竞赛的既定逻辑:用 2048 张 H800 GPU,两个月训练出了一个媲美全球顶尖水平的模型。 这一突破不仅撼动了英伟达万亿市值,更引发了整个行业的反思:在通往 AGI 的征程上,我们是否过于盲信算力规模,而忽视了一条更加务实且充满创新可能的路径?
DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉
经过一系列测试 —— 从创意写作到复杂的教学,DeepSeek-R1 的综合实力完全能和 OpenAI 的付费「精英」们掰手腕。 原来用对方法,性价比路线也能玩转 AI 竞技场! DeepSeek 发布其开放权重的 R1 推理模型仅一周时间,多次震惊海内外。
UC 伯克利等最新研究:大语言模型就是比人类啰嗦,“提问的艺术”仍难参透
不过由大模型给出的考题,和人类出的题目究竟有没有差别,以及有哪些差别?
调查显示:美国青少年对大型科技公司的信任正在下降
Common Sense的调查发现,64%的青少年表示不相信大型科技公司会关心他们的心理健康,62%的青少年认为这些公司若涉及到利润问题,就不会保证他们的安全。
印度启动创建本土 AI 基础模型计划:目标训出“有文化特色”的模型
“我们已经构建了框架,并今天正式启动。我们的核心目标是开发能够反映印度本土语境和文化的人工智能模型。”
大模型训练开销还能更小:微软推出首个 FP4 训练框架,训练效果与 BF16 相当
首个 FP4 精度的大模型训练框架来了,来自微软研究院!在相同超参数的设置下,可以达到与 FP8 以及 BF16 相当的训练效果。
股东施压苹果:要求其公开 AI“黑匣子”,提高隐私保护透明度
根据最新披露的股东提案,多名股东向苹果公司施压,要求其披露更多的 AI 活动细节,进一步提高训练和推理 Apple 智能(Apple Intelligence)的透明度。
DeepSeek 应用在意大利应用商店下架,此前曾被该国隐私监管机构盯上
DeepSeek 应用已从意大利的 Google Play 和苹果 App Store 中下架。虽然确切原因未知,但猜测可能与意大利隐私监管机构 Garante 此前对 DeepSeek 提出的数据隐私问题有关。