资讯列表

Meta杨立昆引燃全民大讨论:美政府有些人被洗脑了,监管让开源变得像非法一样!Meta也犯过错!大模型不如猫,保质期就3年!

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)1月23日,在冬季达沃斯论坛的“辩论技术”环节,Meta公司副总裁兼首席人工智能科学家Yann Lecun、麻省理工学院媒体实验室主任 Dava Newman、Axios首席技术记者Ina Turpen Fried(主持人)就未来十年前沿科技进行了时长47分钟的“全民”大讨论,话题涵盖了LLM、智能体、消费机器人、脑机接口、跨物种、太空探索,也讨论了非常让Meta敏感的“技术作恶”、审查监管、开闭源之争。 观众们更是抓住机会让两位嘉宾抖出了很多猛料。 Lecun表示,现在的大模型并没有达到预期效果,在很多方面都存在不足:“我认为当前 LLM范式的保质期相当短,可能只有3到5年。

世界模型再进化!博士AdaWM:自适应世界模型规划新SOTA

本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接::基于自适应世界模型的自动驾驶规划。 基于世界模型的强化学习(RL)已经成为一种有前景的自动驾驶方法,它学习潜在动态模型并且用其训练规划策略。

重构的道法术器:探讨AI智能对工具的影响

经过影片出租店的完整演练,对这样一个如麻雀般完整而小的遗留项目展开重构,使得我们对重构建立了一个整体的印象,也有利于我们将前面介绍的各种重构知识串联起来,现在,有必要对整个重构做一次复盘。 为了帮助大家更好地理解重构,我认为可以从道、法、术、器这四个层次做一番总结。 图片道是万物变迁循环中亘古不变的规律,是自然环境、事物的自然规律和发展方向。

人类最后一次考试,AI惨败正确率<10%!数百顶级专家联手出题,DeepSeek竟是王者

捍卫「人类智慧」最后一战!刚刚,Scale AI和Center for AI Safety(CAIS)公布了「人类最后一场考试」结果! 新基准全称「人类最后一次考试」(Humanity’s Last Exam),简称「HLM」,包含3000个问题,由数百位领域专家开发,用于追寻人类知识推理的边界。 目前,最好的模型,准确率也小于10%,而且自信「过头」。

TeleAI “复杂推理大模型” 达竞赛级数学表现,评分超 o1-preview

近日,中国电信人工智能研究院(TeleAI)“复杂推理大模型” TeleAI-t1-preview 正式发布,即将上线天翼 AI 开放平台。 TeleAI-t1-preview 使用了强化学习训练方法,通过引入探索、反思等思考范式,大幅提升模型在数学推导、逻辑推理等复杂问题的准确性。 早在 1500 多年前,数学家祖冲之就曾在《辩戴法兴难新历》中指出,复杂事物的运行规律并非超自然现象,而是可以通过实际观测、数据推理而严谨求得。

解密FedDAT:首个多模态异构联邦学习高效微调框架,突破数据异构与通信瓶颈!

FedDAT: An Approach for Foundation Model Finetuning in Multi-Modal Heterogeneous Federated Learning一、 一眼概览FedDAT提出了一种创新的双适配器教师框架(Dual-Adapter Teacher, DAT),结合参数高效微调和互知识蒸馏,解决了多模态异构联邦学习(FL)中的数据异构性问题,并在多个视觉-语言任务基准上取得了最优表现。 二、核心问题如何在多模态联邦学习环境中,在数据异构性和通信预算限制下,实现基础模型的高效分布式微调,以提升视觉-语言任务的性能,是本研究的核心问题。 三、 技术亮点1.

曝DeepSeek让Llama4未发布已落后!小扎坐不住了:2025预算4000亿起步,年底AI算力将达130万卡

Meta这次真的坐不住了,计划在AI上继续加码! 匿名员工爆料,黑马DeepSeek的出现,让Llama 4还未发布就已经落后,Meta慌了。 就在这一消息沸沸扬扬时,小扎放出消息,2025年继续扩大AI投资。

DeepSeek-R1持续震撼硅谷:跻身竞技榜前三,创始人梁文锋采访被“拿放大镜”看

“神秘东方力量”DeepSeek给硅谷带来的影响,还在不断泛起涟漪——刚刚,DeepSeek-R1跻身大模型竞技榜前三。 以开源、便宜20倍的“身价”与ChatGPT-4o(2024.11.20)并列。 在复杂提示词/风格控制榜单上,R1位列第一。

CS本科就业寒冬来袭!名校24届就业率被曝不足50%,企业宁用AI不招应届生

前段时间,UC伯克利CS本科生毕业即失业,以及焦虑的AI博士们在顶会现场后悔读博的故事,曾引起了业界的广泛关注。 今天,一条知乎热搜,再次引起了全网热议。 (图片经过处理)有传言称,某高校计算机学院的24届本科生,就业不足50%,低于全校平均水平。

让AI成为你的React代码专家的3个秘诀

深夜,我盯着眼前庞大的React项目,一行行代码仿佛在跳动。 作为一名全栈开发者,我深知重构这样的项目将耗费无数个不眠之夜。 然而,当我尝试让AI协助修改代码时,却屡屡遇到挫折:组件太复杂导致AI理解困难,代码结构混乱让AI无从下手,项目依赖关系复杂使得AI难以准确推断......如何让AI真正成为我们的得力助手?

物理测试暴击AI圈,DeepSeek R1稳超o1、Claude,我们已进入RL黄金时代

我们都没预料到,AI 领域的 2025 年是这样开始的。 DeepSeek R1 真是太厉害了! 最近,「神秘的东方力量」DeepSeek 正在「硬控」硅谷。

年末惊喜!ByteDance Research视频理解大模型「眼镜猴」正式发布

最近,ByteDance Research 的视频理解大模型眼镜猴(Tarsier) 迎来了巨大更新,发布了第二代模型 Tarsier2 及相关技术报告。 研究团队此前发布的 Tarsier-7B/34B 在视频描述领域已经是最强开源模型,仅次于闭源模型 Gemini-1.5-Pro 和 GPT-4o。 那么这次新版 Tarsier2 又会带给我们什么样的惊喜呢?

英伟达RTX 5090评测解禁,天赋都点在了 AI 上

久等了。 本周三,各路媒体对英伟达 GeForce RTX 5090 的评测宣告解禁。 基于最新 Blackwell 架构,新一代旗舰显卡无疑将成为未来几年你能买到的最好的显卡。

OpenAI 又将面临版权诉讼:印度出版商指控其擅自使用受保护内容训练模型

“我们的诉求很明确,就是要求法院阻止 OpenAI 继续访问我们的受版权保护内容。”此次诉讼关注的是 ChatGPT 所生成的书籍摘要。

印度首富计划建设“世界最大”数据中心,预计投资 200~300 亿美元

知情人士透露,这位 67 岁的商业巨头正在采购英伟达的高性能人工智能芯片,并计划建造一个容量高达 3 吉瓦(gigawatt)的数据中心。若该项目顺利推进,这一容量将远超当前全球运营的任何数据中心。

中国电信发布“复杂推理大模型”TeleAI-t1-preview:能解《九章算术》题目

据介绍,TeleAI-t1-preview 使用了强化学习训练方法,通过引入探索、反思等思考范式,大幅提升模型在逻辑推理、数学推导等复杂问题的准确性。

AMD:已将 DeepSeek-V3 模型集成到 Instinct MI300X GPU 上,利用 SGLang 彻底改变 AI 开发

AMD 还透露,SGLang 和 DeepSeek 团队通力合作,使 DeepSeek V3 FP8 从首发当天就能在英伟达和 AMD GPU 上运行。

刘庆峰:科大讯飞将做全栈自主可控的大模型国家队

刘庆峰还透露了 2025 年业务发展战略:“加强 C 端、做深 B 端,选择 G 端,产品为王,真正给客户创造价值。”