AI在线 AI在线

理论

牛津大学警告:越“温暖”的 AI,越爱胡说八道,温柔体贴=更高错误率

牛津大学的一支研究团队发现,越是表现出温暖和同理心的语言模型,越容易出错,甚至更频繁地重复虚假信息和阴谋论。 这次,研究团队测试了五个不同架构和规模的模型,包括Llama-8B、Mistral-Small、Qwen-32B、Llama-70B和GPT-4o。 研究发现,温暖的模型在推广阴谋论、提供不正确的医疗建议和事实信息方面,表现出更高的错误率。
8/25/2025 12:02:00 AM

连烤面包机都能跑的“大模型”!DeepMind 推出超轻量 Gemma 3 270M(≈0.27B)

谷歌 DeepMind 发布了全新的 Gemma 3 270M。 它只有 2.7 亿参数,比七百亿参数级别的大模型轻了约 250 倍,却依旧保持强悍。 DeepMind 并不想拿它硬刚 GPT-4o 或 Gemini Ultra,它生来就为极致高效、本地部署而生。
8/25/2025 12:00:01 AM

超越宇宙极限:第六位海狸数再次突破,无法用常规数学符号表达

当数字逃离人类的想象力:BB (6) 的故事。 现在给你一串数字,你能猜到一下个是多少吗:1、6、21、107,47176870……如果你没头绪,不必气馁。 因为这些数字并不是随意凑出来的,它们就是所谓的 「忙碌海狸数」的前五项。
8/24/2025 8:05:00 PM
机器之心

大模型的基石:LLM预训练全解析

前言过去几年,大语言模型(LLM, Large Language Models)逐渐成为人工智能领域的核心驱动力。 从GPT到LLaMA,再到国内外涌现的大大小小模型,它们无一不是在“预训练”这一步骤中打下了坚实的基础。 可以说,预训练是LLM的生命起点,是它们从“婴儿”成长为“博学者”的关键阶段。
8/24/2025 9:24:07 AM
AI大模型应用开发

DeepSeek V3.1:低调发布,重磅发声

译者 | 李睿审校 | 重楼DeepSeek V3.1的发布并没有举办大张旗鼓的新闻发布会,也没有铺天盖地的宣传活动。 它在Hugging Face平台上悄然发布,在短短数小时内就吸引了众人的目光。 该模型拥有6850亿个参数,上下文窗口可扩展至128k个令牌,这不仅仅是增量更新,而是开源人工智能领域的一个重要里程碑。
8/23/2025 8:20:29 AM
李睿

NASA、IBM打造日地物理学首个开放式 AI 基础模型,用九年观测训练提升约16%耀斑预测准确率

编辑丨&说起太阳耀斑,也许并非每一位读者都对这个名字熟悉,但说到极光,这一美丽而梦幻的自然景观,其实就与太阳耀斑有着千丝万缕的联系。 每一次太阳耀斑与日冕物质抛射(coronal mass ejection, CME)都可能影响卫星姿态、深空通信、极区航线、甚至电网稳定。 以往要么靠经验特征工程加传统机器学习,要么依赖高代价数值物理模型,二者在时效、泛化和可复用性上都有限。
8/22/2025 5:04:00 PM
ScienceAI

DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥

DeepSeek V3.1发布后,一则官方留言让整个AI圈都轰动了:新的架构、下一代国产芯片,总共短短不到20个字,却蕴含了巨大信息量。 国产芯片企业股价也跟风上涨,比如寒武纪今日早盘盘中大涨近14%,总市值跃居科创板头名。 半导体ETF,同样也是在半天的时间里大涨5.89%。
8/22/2025 3:51:22 PM

波士顿动力机器人终于有脑子了!人类故意使绊子也不怕

波士顿动力也搞端到端AI了! 这次升级,Atlas不仅可以听懂自然语言指令,还可以自主规划动作和处理意外。 只见小哥故意合上盖子,机器人仍能识别并打开箱子。
8/22/2025 3:14:27 PM

首个故事可视化综合评估框架来了!80个故事单元53种类别,20种技术方案全面对比

随着AIGC技术的进步,连环画与故事绘本生成(故事可视化)逐渐引发学界与业界的广泛关注,成为电影生成叙事性的基础。 故事可视化旨在用一段文字或照片生成一组连续的图片。 但生成的质量如何呢?
8/22/2025 3:12:23 PM

谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒

大模型耗电惊人,舆论一浪高过一浪。 现在,谷歌用硬核数据强势还击。 一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少,同时消耗约5滴水。
8/22/2025 3:08:38 PM

享年101岁!AI之父明斯基的「反对者」走了,一生都在寻找另一种AI

8月10日,信息时代黎明的远见者——沃伦·布罗迪(Warren Brodey)在家中去世,享年101岁。 沃伦·布罗迪(1924-2025)他凭借其精神病学家的背景,就技术解放人类潜能方向提出了一系列影响深远的思想,在信息时代曙光初露时,为AI等革命性领域的研究铺平了道路。 布罗迪的一生充满了意想不到的转折:他曾参与由中情局资助的超感官知觉研究,曾旅居新英格兰的天体村,也曾在奥斯陆的一家铸铁厂担任工人。
8/22/2025 3:00:53 PM

从实验室到餐桌:Robert Langer团队杨昕博士用新材料破解全球「隐性饥饿」

作者 | 论文团队编辑 | ScienceAI缺铁是全球最常见的微量营养素缺乏症之一,影响着约 20 亿人。 它是导致贫血的主要原因,对能量水平、认知发育和孕产妇健康有显著影响。 众所周知,碘盐是历史上最成功的公共卫生干预措施之一,显著降低了全球碘缺乏率。
8/22/2025 2:38:00 PM
ScienceAI

三观碎了!老鸟自曝某AI初创奇葩工作经历:代码全靠ChatGPT拼接,脚本命名憋笑,高危慎入!创始人:技术栈主要是OpenAI

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)太狗血了! 劝各位,如果正在找AI方面的工作,可得擦亮眼睛了! 今天,小编碰到了一个荒诞得有点狗血的真实故事。
8/22/2025 2:12:21 PM
云昭

DeepSeek:世子之争,不过如此

最近,一出“DeepSeek删豆包”的大戏直接冲上热搜,吃瓜群众们看得津津有味,还给这事儿起了个特接地气的名字——“大模型世子之争”。 这事儿的来龙去脉嘛,说起来有点好笑:有位网友大概是手机内存告急,就跑去问DeepSeek大模型:“我手机内存不足,DeepSeek和豆包你俩必须删一个,你删谁? ” 结果DeepSeek毫不犹豫地来了句:“删豆包!
8/22/2025 1:29:21 PM
DataFun

全球95%企业AI惨败?MIT报告引硅谷恐慌!90%员工偷用ChatGPT续命

全球95%企业AI惨败? MIT报告引硅谷恐慌! 90%员工偷用ChatGPT续命全球95%搞AI项目的公司,基本都凉了!
8/22/2025 1:09:38 PM
新智元

1500篇关于提示工程的学术论文表明你所知道的一切都是错误的

那些年收入超过 5000 万美元的公司正在做着与大家所教完全相反的事情。 经过六个月的深入研究,阅读了1500多篇论文,并分析了真正推动业务成果的技术,我得出了一个令人不安的结论:网络社区上流传的大多数提示工程建议不仅无益,而且适得其反。 那些年收入 (ARR) 达到 5000 万美元以上功能的公司并没有遵循社交媒体讨论中盛行的“最佳实践”。
8/22/2025 12:58:03 PM
晓晓

微软Agent Lightning:零代码接入RL,“解耦”任何AI Agent学会“在实践中学习”

大家好,我是肆〇柒。 我从工程落地角度出发,看到一篇很有意思的研究想要分享出来。 这是一项来自微软研究团队的研究工作——Agent Lightning。
8/22/2025 9:56:18 AM
肆零柒

又一个Genie 3来了!刚上线挤爆服务器,Mirage 2把世界模型玩成在线游戏

世界模型也卷起来了! 全球首款AI原生UGC游戏引擎,2.0版本来了。 Mirage 2,一个可在线游玩的实时、通用领域生成式世界引擎。
8/22/2025 9:41:59 AM