资讯列表

分类

标签

英伟达年终大礼，最强AI GPU曝光！全新B300让o1/o3推理性能上天算力爆表

多亏了老黄，圣诞节如期而至。尽管Blackwell GPU多次因硅片、封装和底板问题而推迟发布，但这并不能阻挡他们前进的脚步。距离GB200和B200的发布才刚刚过去几个月，英伟达便推出了全新一代的AI GPU——GB300和B300。

12/27/2024 12:23:46 PM

新智元

轨迹跟踪误差直降50％，清华汪玉团队强化学习策略秘籍搞定无人机

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

12/27/2024 11:57:00 AM

机器之心

把RLHF带给VLA模型！通过偏好对齐来优化机器人策略，代码已开源

论文一作为北卡罗来纳大学教堂山分校张子健，指导老师为北卡罗来纳大学教堂山分校助理教授 Huaxiu Yao。共同第一作者为华盛顿大学 Kaiyuan Zheng，其余作者包括来自北卡教堂山的 Mingyu Ding、来自华盛顿大学的 Joel Jang、Yi Li 和Dieter Fox，以及来自芝加哥大学的 Zhaorun Chen、Chaoqi Wang。论文标题：GRAPE: Generalizing Robot Policy via Preference Alignment论文链接：：：，视觉-语言-动作模型（Vision-Language-Action, VLA）在诸多机器人任务上取得了显著的进展，但它们仍面临一些关键问题，例如由于仅依赖从成功的执行轨迹中进行行为克隆，导致对新任务的泛化能力较差。

12/27/2024 11:52:25 AM

全球首个重症医疗大模型：腾讯 X 迈瑞发布“启元重症大模型”，已用于 ICU 病房

它的工作流程，大致分为「两步」：先是整合患者的海量数据，生成数字画像；随后，用重症思维对画像进行深度分析，预测病情发展，提出干预建议。

12/27/2024 11:12:30 AM

汪淼

中国MoE一夜爆火！大模型新王暴打GPT-4o，训练成本仅600万美元

一夜之间，来自中国的大模型刷屏全网。 DeepSeek-V3，一个拥有671B参数的MoE模型，吞吐量每秒高达60 token，比上一代V2直接飙升3倍。在多项基准测试中，V3性能直接与Claude 3.5 Sonnet、GPT-4o相匹敌。

12/27/2024 10:27:58 AM

新智元

AI点亮工厂之路：1月9日开年论坛，解锁智能制造密码！

在科技浪潮的推动下，我国生产制造领域正经历着一场深刻的变革。 “中国制造”向“中国智造”转型的故事正在上演，智能制造的未来发展趋势如何？应如何把握发展时机，在人工智能时代的驱动下，推动“AI ”助力企业实现数字化智能转型。

12/27/2024 10:23:00 AM

机器之心

AI Agent引领，火山引擎HiAgent助力实体产业智能化升级

12月18日，2024火山引擎FORCE原动力大会·冬在上海举办，火山引擎带来豆包大模型家族全新升级。当天下午，在“AI Agent引领，实体产业智能化升级”专场论坛上，火山引擎发布了企业专属AI应用创新平台HiAgent 1.5 版本，新版本在敏捷迭代、知识增强、用户交互等方面全维提升，进一步助力企业打造 AI 原生应用，火山引擎还集中展示了实体产业智能化升级标杆案例。专场论坛现场，火山引擎副总裁张鑫首先做开场致辞。

12/27/2024 10:20:30 AM

AAAI 2025 | 合成数据助力自驾点云异常检测新SOTA

论文信息论文题目：LiON: Learning Point-wise Abstaining Penalty for LiDAR Outlier DetectioN Using Diverse Synthetic Data论文发表单位：清华大学, 厦门大学，滴滴出行, 香港中文大学-深圳论文地址：：。然而，由于点云不像图像那样具有丰富的语义信息，在点云中这个识别异常点是一项极具挑战性的任务。本工作从两个方面缓解了点云缺乏语义信息对异常点感知的影响：1) 提出了一种新的学习范式，使模型能够学习更鲁棒的点云表征，增强点与点之间的辨别性；2) 借助额外的数据源，ShapeNet，提出了一套可以生成多样且真实伪异常的方法。

12/27/2024 10:00:00 AM

自动驾驶之心

Deepseek v3正式发布：用557.6万美金超越Claude 3.5 Sonnet的惊人杰作

2024年12月26日，DeepSeek AI正式发布了其最新的大型语言模型——DeepSeek-V3，每秒处理 60 个 token，比 V2 快 3 倍！ MoE架构,6710 亿参数，激活 370 亿参数，训练基于 14.8 万亿高质量 token，完全开源,附送53页pdf技术论文主要看点1.DeepSeek-V3 采用了创新的知识蒸馏方法，将 DeepSeek R1 系列模型中的推理能力迁移到标准 LLM 中。该方法巧妙地融合了 R1 的验证和反思模式，显著提高了 DeepSeek-V3 的推理性能，同时又保留了对输出风格和长度的控制2.首次在大规模模型上验证了 FP8 训练的可行性和有效性3.通过协同优化，有效克服了跨节点 MoE 训练中的通信瓶颈，使得计算与通信几乎完全重叠4.在 DeepSeek-V2 高效架构的基础上，DeepSeek-V3 引入无辅助损失的负载均衡策略和多标记预测（MTP）目标，不仅提升模型性能，还支持推理加速的预测解码5.仅耗费了 266.4万 H800 GPU 小时，就完成了对 14.8 万亿 token 的预训练。

12/27/2024 9:50:00 AM

AI寒武纪

突发！ChatGPT、Sora、API发生重大错误，宕机数小时

今天凌晨5点，OpenAI宣布，ChatGPT、Sora和API产生了重大错误，大部分已经宕机了几个小时。但已经确定了问题所在，并已开始着手恢复。不过这下可让Sam Altman难看了，前几天他还特意发文送出圣诞节特别奖励——无限使用Sora。

12/27/2024 9:40:25 AM

AIGC开放社区

消息称比亚迪成立未来实验室研发具身智能：包含机器人

据“每人 Auto”26 日援引独立信源消息称，比亚迪第十五事业部成立了一个专门的团队研发具身智能，事业部最高负责人罗忠良直接主管该项目。

12/27/2024 9:28:36 AM

清源

15大机构十年研究证明：无约束AI必然超越人类，创造能力也更强！

人工智能领域已经发展了70年，从小数据验证，到大规模基准，再发展到现在，几乎每天都有新突破，不只是在简单问题上超越普通人类水准，在最难的问题上也能和顶尖人类掰掰手腕了。但还有一个自人工智能诞生以来就一直广为讨论、看是无解的关键问题，各方业内人士仍然争辩不休：如果没有适当的限制和治理，人工智能在未来是否会发展到超越人类智能？最近，来自东南大学、哈佛医学院、新加坡国立大学、新加坡南洋理工大学、新加坡国立脑科学研究院、清华大学、中山大学等多达15个顶尖机构的研究人员联合发表了一篇论文，在理论上证明了AI超越人类的可能性，即通过结合神经科学中的新型AI技术，可以创建出一个新的AI智能体，能够在细胞层面上精确模拟大脑及其功能系统（例如感知和认知功能），并且预期误差极小。

12/27/2024 9:15:00 AM

新智元

微软和 OpenAI 的 AI 金钱游戏：通用人工智能价码 1000 亿美元

科技媒体 The Information 昨日（12 月 26 日）披露了一份微软和 OpenAI 公司的合同文件，秘密为通用人工智能（AGI）贴上价格标签。

12/27/2024 9:09:02 AM

故渊

Cursor 深度评测：革命性提效工具还是过誉的玩具？

最近 Cursor 很火，火到我身边的程序员们已经不聊河北彩花，LOL，黑猴等，而是在各种场合讨论这个 Cursor 的辅助编程能力。各类内容平台也在以惊人的速度，迭代出了许多相关教学视频：图片我试用了一段时间，第一感觉确实很惊艳，能帮我解决很多基础问题，实打实地提升开发效率，印象比较深的，包括：Codebase Indexing、@symbol 等功能带来的更强的上下文索引能力，而这极大提升最终 LLM 生成的代码效果；Cursor Composer 功能提供了一个注意力非常聚焦的编程面板，相比于过往 GPT 等产品的即聊即抛的模式，更容易做好跨文件的编辑开发，而这更符合专业开发者的模块化编程习惯。但是，我觉得，至少在当下阶段，这类产品的定位只能是“辅助编程”，虽然能极大提升效率，但还只是编程活动中的辅助客体，俗称打下手；程序员本体 —— 人类智能依然是主体地位，有点类似于掌柜的吧。

12/27/2024 9:05:18 AM

范文杰