理论
牛津大学警告:越“温暖”的 AI,越爱胡说八道,温柔体贴=更高错误率
牛津大学的一支研究团队发现,越是表现出温暖和同理心的语言模型,越容易出错,甚至更频繁地重复虚假信息和阴谋论。 这次,研究团队测试了五个不同架构和规模的模型,包括Llama-8B、Mistral-Small、Qwen-32B、Llama-70B和GPT-4o。 研究发现,温暖的模型在推广阴谋论、提供不正确的医疗建议和事实信息方面,表现出更高的错误率。
8/25/2025 12:02:00 AM
连烤面包机都能跑的“大模型”!DeepMind 推出超轻量 Gemma 3 270M(≈0.27B)
谷歌 DeepMind 发布了全新的 Gemma 3 270M。 它只有 2.7 亿参数,比七百亿参数级别的大模型轻了约 250 倍,却依旧保持强悍。 DeepMind 并不想拿它硬刚 GPT-4o 或 Gemini Ultra,它生来就为极致高效、本地部署而生。
8/25/2025 12:00:01 AM
超越宇宙极限:第六位海狸数再次突破,无法用常规数学符号表达
当数字逃离人类的想象力:BB (6) 的故事。 现在给你一串数字,你能猜到一下个是多少吗:1、6、21、107,47176870……如果你没头绪,不必气馁。 因为这些数字并不是随意凑出来的,它们就是所谓的 「忙碌海狸数」的前五项。
8/24/2025 8:05:00 PM
机器之心
大模型的基石:LLM预训练全解析
前言过去几年,大语言模型(LLM, Large Language Models)逐渐成为人工智能领域的核心驱动力。 从GPT到LLaMA,再到国内外涌现的大大小小模型,它们无一不是在“预训练”这一步骤中打下了坚实的基础。 可以说,预训练是LLM的生命起点,是它们从“婴儿”成长为“博学者”的关键阶段。
8/24/2025 9:24:07 AM
AI大模型应用开发
DeepSeek V3.1:低调发布,重磅发声
译者 | 李睿审校 | 重楼DeepSeek V3.1的发布并没有举办大张旗鼓的新闻发布会,也没有铺天盖地的宣传活动。 它在Hugging Face平台上悄然发布,在短短数小时内就吸引了众人的目光。 该模型拥有6850亿个参数,上下文窗口可扩展至128k个令牌,这不仅仅是增量更新,而是开源人工智能领域的一个重要里程碑。
8/23/2025 8:20:29 AM
李睿
NASA、IBM打造日地物理学首个开放式 AI 基础模型,用九年观测训练提升约16%耀斑预测准确率
编辑丨&说起太阳耀斑,也许并非每一位读者都对这个名字熟悉,但说到极光,这一美丽而梦幻的自然景观,其实就与太阳耀斑有着千丝万缕的联系。 每一次太阳耀斑与日冕物质抛射(coronal mass ejection, CME)都可能影响卫星姿态、深空通信、极区航线、甚至电网稳定。 以往要么靠经验特征工程加传统机器学习,要么依赖高代价数值物理模型,二者在时效、泛化和可复用性上都有限。
8/22/2025 5:04:00 PM
ScienceAI
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
DeepSeek V3.1发布后,一则官方留言让整个AI圈都轰动了:新的架构、下一代国产芯片,总共短短不到20个字,却蕴含了巨大信息量。 国产芯片企业股价也跟风上涨,比如寒武纪今日早盘盘中大涨近14%,总市值跃居科创板头名。 半导体ETF,同样也是在半天的时间里大涨5.89%。
8/22/2025 3:51:22 PM
波士顿动力机器人终于有脑子了!人类故意使绊子也不怕
波士顿动力也搞端到端AI了! 这次升级,Atlas不仅可以听懂自然语言指令,还可以自主规划动作和处理意外。 只见小哥故意合上盖子,机器人仍能识别并打开箱子。
8/22/2025 3:14:27 PM
首个故事可视化综合评估框架来了!80个故事单元53种类别,20种技术方案全面对比
随着AIGC技术的进步,连环画与故事绘本生成(故事可视化)逐渐引发学界与业界的广泛关注,成为电影生成叙事性的基础。 故事可视化旨在用一段文字或照片生成一组连续的图片。 但生成的质量如何呢?
8/22/2025 3:12:23 PM
谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒
大模型耗电惊人,舆论一浪高过一浪。 现在,谷歌用硬核数据强势还击。 一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少,同时消耗约5滴水。
8/22/2025 3:08:38 PM
享年101岁!AI之父明斯基的「反对者」走了,一生都在寻找另一种AI
8月10日,信息时代黎明的远见者——沃伦·布罗迪(Warren Brodey)在家中去世,享年101岁。 沃伦·布罗迪(1924-2025)他凭借其精神病学家的背景,就技术解放人类潜能方向提出了一系列影响深远的思想,在信息时代曙光初露时,为AI等革命性领域的研究铺平了道路。 布罗迪的一生充满了意想不到的转折:他曾参与由中情局资助的超感官知觉研究,曾旅居新英格兰的天体村,也曾在奥斯陆的一家铸铁厂担任工人。
8/22/2025 3:00:53 PM
从实验室到餐桌:Robert Langer团队杨昕博士用新材料破解全球「隐性饥饿」
作者 | 论文团队编辑 | ScienceAI缺铁是全球最常见的微量营养素缺乏症之一,影响着约 20 亿人。 它是导致贫血的主要原因,对能量水平、认知发育和孕产妇健康有显著影响。 众所周知,碘盐是历史上最成功的公共卫生干预措施之一,显著降低了全球碘缺乏率。
8/22/2025 2:38:00 PM
ScienceAI
三观碎了!老鸟自曝某AI初创奇葩工作经历:代码全靠ChatGPT拼接,脚本命名憋笑,高危慎入!创始人:技术栈主要是OpenAI
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)太狗血了! 劝各位,如果正在找AI方面的工作,可得擦亮眼睛了! 今天,小编碰到了一个荒诞得有点狗血的真实故事。
8/22/2025 2:12:21 PM
云昭
DeepSeek:世子之争,不过如此
最近,一出“DeepSeek删豆包”的大戏直接冲上热搜,吃瓜群众们看得津津有味,还给这事儿起了个特接地气的名字——“大模型世子之争”。 这事儿的来龙去脉嘛,说起来有点好笑:有位网友大概是手机内存告急,就跑去问DeepSeek大模型:“我手机内存不足,DeepSeek和豆包你俩必须删一个,你删谁? ” 结果DeepSeek毫不犹豫地来了句:“删豆包!
8/22/2025 1:29:21 PM
DataFun
全球95%企业AI惨败?MIT报告引硅谷恐慌!90%员工偷用ChatGPT续命
全球95%企业AI惨败? MIT报告引硅谷恐慌! 90%员工偷用ChatGPT续命全球95%搞AI项目的公司,基本都凉了!
8/22/2025 1:09:38 PM
新智元
1500篇关于提示工程的学术论文表明你所知道的一切都是错误的
那些年收入超过 5000 万美元的公司正在做着与大家所教完全相反的事情。 经过六个月的深入研究,阅读了1500多篇论文,并分析了真正推动业务成果的技术,我得出了一个令人不安的结论:网络社区上流传的大多数提示工程建议不仅无益,而且适得其反。 那些年收入 (ARR) 达到 5000 万美元以上功能的公司并没有遵循社交媒体讨论中盛行的“最佳实践”。
8/22/2025 12:58:03 PM
晓晓
微软Agent Lightning:零代码接入RL,“解耦”任何AI Agent学会“在实践中学习”
大家好,我是肆〇柒。 我从工程落地角度出发,看到一篇很有意思的研究想要分享出来。 这是一项来自微软研究团队的研究工作——Agent Lightning。
8/22/2025 9:56:18 AM
肆零柒
又一个Genie 3来了!刚上线挤爆服务器,Mirage 2把世界模型玩成在线游戏
世界模型也卷起来了! 全球首款AI原生UGC游戏引擎,2.0版本来了。 Mirage 2,一个可在线游玩的实时、通用领域生成式世界引擎。
8/22/2025 9:41:59 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测