AI在线 AI在线

资讯列表

英伟达年终大礼,最强AI GPU曝光!全新B300让o1/o3推理性能上天算力爆表

多亏了老黄,圣诞节如期而至。 尽管Blackwell GPU多次因硅片、封装和底板问题而推迟发布,但这并不能阻挡他们前进的脚步。 距离GB200和B200的发布才刚刚过去几个月,英伟达便推出了全新一代的AI GPU——GB300和B300。
12/27/2024 12:23:46 PM
新智元

轨迹跟踪误差直降50%,清华汪玉团队强化学习策略秘籍搞定无人机

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
12/27/2024 11:57:00 AM
机器之心

把RLHF带给VLA模型!通过偏好对齐来优化机器人策略,代码已开源

论文一作为北卡罗来纳大学教堂山分校张子健,指导老师为北卡罗来纳大学教堂山分校助理教授 Huaxiu Yao。 共同第一作者为华盛顿大学 Kaiyuan Zheng,其余作者包括来自北卡教堂山的 Mingyu Ding、来自华盛顿大学的 Joel Jang、Yi Li 和Dieter Fox,以及来自芝加哥大学的 Zhaorun Chen、Chaoqi Wang。 论文标题:GRAPE: Generalizing Robot Policy via Preference Alignment论文链接:::,视觉-语言-动作模型(Vision-Language-Action, VLA)在诸多机器人任务上取得了显著的进展,但它们仍面临一些关键问题,例如由于仅依赖从成功的执行轨迹中进行行为克隆,导致对新任务的泛化能力较差。
12/27/2024 11:52:25 AM

全球首个重症医疗大模型:腾讯 X 迈瑞发布“启元重症大模型”,已用于 ICU 病房

它的工作流程,大致分为「两步」:先是整合患者的海量数据,生成数字画像;随后,用重症思维对画像进行深度分析,预测病情发展,提出干预建议。
12/27/2024 11:12:30 AM
汪淼

中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅600万美元

一夜之间,来自中国的大模型刷屏全网。 DeepSeek-V3,一个拥有671B参数的MoE模型,吞吐量每秒高达60 token,比上一代V2直接飙升3倍。 在多项基准测试中,V3性能直接与Claude 3.5 Sonnet、GPT-4o相匹敌。
12/27/2024 10:27:58 AM
新智元

AI点亮工厂之路:1月9日开年论坛,解锁智能制造密码!

在科技浪潮的推动下,我国生产制造领域正经历着一场深刻的变革。 “中国制造”向“中国智造”转型的故事正在上演,智能制造的未来发展趋势如何? 应如何把握发展时机,在人工智能时代的驱动下,推动“AI ”助力企业实现数字化智能转型。
12/27/2024 10:23:00 AM
机器之心

AI Agent引领,火山引擎HiAgent助力实体产业智能化升级

12月18日,2024火山引擎FORCE原动力大会·冬在上海举办,火山引擎带来豆包大模型家族全新升级。 当天下午,在“AI Agent引领,实体产业智能化升级”专场论坛上,火山引擎发布了企业专属AI应用创新平台HiAgent 1.5 版本,新版本在敏捷迭代、知识增强、用户交互等方面全维提升,进一步助力企业打造 AI 原生应用,火山引擎还集中展示了实体产业智能化升级标杆案例。 专场论坛现场,火山引擎副总裁张鑫首先做开场致辞。
12/27/2024 10:20:30 AM

AAAI 2025 | 合成数据助力自驾点云异常检测新SOTA

论文信息论文题目:LiON: Learning Point-wise Abstaining Penalty for LiDAR Outlier DetectioN Using Diverse Synthetic Data论文发表单位:清华大学, 厦门大学,滴滴出行, 香港中文大学-深圳论文地址::。 然而,由于点云不像图像那样具有丰富的语义信息,在点云中这个识别异常点是一项极具挑战性的任务。 本工作从两个方面缓解了点云缺乏语义信息对异常点感知的影响:1) 提出了一种新的学习范式,使模型能够学习更鲁棒的点云表征,增强点与点之间的辨别性;2) 借助额外的数据源,ShapeNet,提出了一套可以生成多样且真实伪异常的方法。
12/27/2024 10:00:00 AM
自动驾驶之心

Deepseek v3正式发布:用557.6万美金超越Claude 3.5 Sonnet的惊人杰作

2024年12月26日,DeepSeek AI正式发布了其最新的大型语言模型——DeepSeek-V3,每秒处理 60 个 token,比 V2 快 3 倍! MoE架构,6710 亿参数,激活 370 亿参数,训练基于 14.8 万亿高质量 token,完全开源,附送53页pdf技术论文主要看点1.DeepSeek-V3 采用了创新的知识蒸馏方法,将 DeepSeek R1 系列模型中的推理能力迁移到标准 LLM 中。 该方法巧妙地融合了 R1 的验证和反思模式,显著提高了 DeepSeek-V3 的推理性能,同时又保留了对输出风格和长度的控制2.首次在大规模模型上验证了 FP8 训练的可行性和有效性3.通过协同优化,有效克服了跨节点 MoE 训练中的通信瓶颈,使得计算与通信几乎完全重叠4.在 DeepSeek-V2 高效架构的基础上,DeepSeek-V3 引入无辅助损失的负载均衡策略和多标记预测(MTP)目标,不仅提升模型性能,还支持推理加速的预测解码5.仅耗费了 266.4万 H800 GPU 小时,就完成了对 14.8 万亿 token 的预训练。
12/27/2024 9:50:00 AM
AI寒武纪

突发!ChatGPT、Sora、API发生重大错误,宕机数小时

今天凌晨5点,OpenAI宣布,ChatGPT、Sora和API产生了重大错误,大部分已经宕机了几个小时。 但已经确定了问题所在,并已开始着手恢复。 不过这下可让Sam Altman难看了,前几天他还特意发文送出圣诞节特别奖励——无限使用Sora。
12/27/2024 9:40:25 AM
AIGC开放社区

消息称比亚迪成立未来实验室研发具身智能:包含机器人

据“每人 Auto”26 日援引独立信源消息称,比亚迪第十五事业部成立了一个专门的团队研发具身智能,事业部最高负责人罗忠良直接主管该项目。
12/27/2024 9:28:36 AM
清源

15大机构十年研究证明:无约束AI必然超越人类,创造能力也更强!

人工智能领域已经发展了70年,从小数据验证,到大规模基准,再发展到现在,几乎每天都有新突破,不只是在简单问题上超越普通人类水准,在最难的问题上也能和顶尖人类掰掰手腕了。 但还有一个自人工智能诞生以来就一直广为讨论、看是无解的关键问题,各方业内人士仍然争辩不休:如果没有适当的限制和治理,人工智能在未来是否会发展到超越人类智能? 最近,来自东南大学、哈佛医学院、新加坡国立大学、新加坡南洋理工大学、新加坡国立脑科学研究院、清华大学、中山大学等多达15个顶尖机构的研究人员联合发表了一篇论文,在理论上证明了AI超越人类的可能性,即通过结合神经科学中的新型AI技术,可以创建出一个新的AI智能体,能够在细胞层面上精确模拟大脑及其功能系统(例如感知和认知功能),并且预期误差极小。
12/27/2024 9:15:00 AM
新智元

微软和 OpenAI 的 AI 金钱游戏:通用人工智能价码 1000 亿美元

科技媒体 The Information 昨日(12 月 26 日)披露了一份微软和 OpenAI 公司的合同文件,秘密为通用人工智能(AGI)贴上价格标签。
12/27/2024 9:09:02 AM
故渊

Cursor 深度评测:革命性提效工具还是过誉的玩具?

最近 Cursor 很火,火到我身边的程序员们已经不聊河北彩花,LOL,黑猴等,而是在各种场合讨论这个 Cursor 的辅助编程能力。 各类内容平台也在以惊人的速度,迭代出了许多相关教学视频:图片我试用了一段时间,第一感觉确实很惊艳,能帮我解决很多基础问题,实打实地提升开发效率,印象比较深的,包括:Codebase Indexing、@symbol 等功能带来的更强的上下文索引能力,而这极大提升最终 LLM 生成的代码效果;Cursor Composer 功能提供了一个注意力非常聚焦的编程面板,相比于过往 GPT 等产品的即聊即抛的模式,更容易做好跨文件的编辑开发,而这更符合专业开发者的模块化编程习惯。 但是,我觉得,至少在当下阶段,这类产品的定位只能是“辅助编程”,虽然能极大提升效率,但还只是编程活动中的辅助客体,俗称打下手;程序员本体 —— 人类智能依然是主体地位,有点类似于掌柜的吧。
12/27/2024 9:05:18 AM
范文杰

联想新一代智能体系统“天禧 AS”发布,明年 Q2 落地 AI PC、AI 手机、AI 平板等

在大会上,新一代智能体系统天禧个人智能体系统(天禧 AS)升级。此次大会还见证了中国软件行业协会 AI 终端智能体创新专业委员会的成立仪式。
12/27/2024 9:03:09 AM
汪淼

集中接入:将大模型统一管理起来,你觉得怎么样?

为什么要集中接入? 集中接入,就是把大模型的接入统一到一个地方管理起来,下面这张图可以很好地帮我们理解集中接入:图片从这个图上,你已经看出来了,所谓的集中接入,其实就是构建了一个代理,我们后面就称它为大模型代理。 到这里,你可能产生这样的疑问:我直接用大模型不好吗?
12/27/2024 8:27:27 AM
greencoatman

智谱开源 GLM-PC 基座模型 CogAgent-9B,让 AI 智能体“看懂”屏幕

智谱技术团队公众号昨日(12 月 26 日)发布博文,宣布开源 GLM-PC 的基座模型 CogAgent-9B-20241220,基于 GLM-4V-9B 训练,专用于 Agent 任务。
12/27/2024 8:11:04 AM
故渊

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE,性能和 GPT-4o 不分伯仲

“深度求索”官方公众号昨日(12 月 26 日)发布博文,宣布上线并同步开源 DeepSeek-V3 模型,用户可以登录官网 chat.deepseek.com,与最新版 V3 模型对话。
12/27/2024 8:02:05 AM
故渊