资讯列表
英特尔至强6独享MRDIMM,内存带宽飙升,加速推理达2.4倍!
之前的文章中,有业者预测至强6性能核处理器每颗计算单元芯片中的内核数量为43,加上每个计算单元有两组双通道内存控制器各占一个网格,那么总共占用43 2=45个网格,可以由5×9的布局构成。 但这个假设有一个问题,要构成128核的6980P,三颗芯片只屏蔽1个内核,这良率要求比较高啊。 至今还未在公开渠道看到至强6性能核处理器的Die shot或架构图,但英特尔发布了晶圆照片作为宣传素材。
12/26/2024 4:00:00 PM
独享MRDIMM有多强?至强6性能核处理器的内存二三事
至强 6 性能核处理器在核数、内存带宽均大幅提升的加持下,推理性能激增,进一步提升了推理的性价比。 至强 6 性能核的核心规模在之前的文章中,有从业者预测至强 6 性能核处理器每颗计算单元芯片中的内核数量为 43,加上每个计算单元有两组双通道内存控制器各占一个网格,那么总共占用 43 2=45 个网格,可以由 5×9 的布局构成。 但这个假设有一个问题,要构成 128 核的 6980P,三颗芯片只屏蔽 1 个内核,这良率要求比较高啊。
12/26/2024 3:59:00 PM
机器之心
SPAR:融合自对弈与树搜索的高性能指令优化框架
大语言模型的指令遵循能力需要模型能够准确识别指令中的细微要求,并在输出中精确体现这些要求。 现有方法通常采用偏好学习进行优化,在创建偏好对时直接从模型中采样多个独立响应。 但是这种方法可能会引入与指令精确遵循无关的内容变化(例如,同一语义的不同表达方式),这干扰了模型学习识别能够改进指令遵循的关键差异。
12/26/2024 3:35:33 PM
SACHIN KUMAR
CMU等提出超实用「模型泛化性」指标,分布外准确率提升6% | ICML 2024 Oral
当前许多深度学习分类模型通常在大规模数据中训练以找到足以区分不同类别的特征。 然而,这种方式不可避免地学到伪相关特征(Spurious Correlation),导致训练的分类器在分布偏移(Distribution Shift)下往往会失效。 因此,如何在衡量一个训练好的模型的泛化性(Generalization)一直是一个关键问题。
12/26/2024 3:30:00 PM
新智元
理想同学 App 明日上线,支持语音交流、识物等功能
据理想汽车官方消息,理想同学 App 将于明日(12 月 27 日)上线。在理想 AI Talk 第三场直播开启(20:00)后,可以通过应用商店(苹果用户)和官网下载(安卓用户)。
12/26/2024 3:05:45 PM
浩渺
Anthropic联创:Scaling Law没崩,但推理成天价!有了TTT,25年AI更加速
Scaling Law要撞墙了? Anthropic联创Jack Clark反驳了这一说法:绝非如此! 在他看来,目前的AI发展还远远没到极限,「所有告诉你AI进展正在放缓,或者Scaling Law正在撞墙的人,都是错误的。
12/26/2024 3:00:09 PM
新智元
蚂蚁群组团“最强 AGI”:破解几何难题“完爆”人类,群体智能登顶 PNAS
你听说过「通用蚂蚁智能」吗?今天,全网爆火一个视频充分展示了什么是 AGI—— 蚂蚁群体智能的智慧。在解决钢琴搬运难题任务中,它们甚至超越了人类,最新研究登上 PNAS。
12/26/2024 2:49:47 PM
清源
Deepseek新模型意外曝光!编程跑分一举超越Claude 3.5 Sonnet
还没等到官宣,Deepseek-v3竟意外曝光了? 据Reddit网友爆料,v3已在API和网页上发布,一些榜单跑分也新鲜出炉。 在Aider多语言编程测试排行榜中,Deepseek-v3一举超越Claude 3.5 Sonnet,排在第1位的o1之后。
12/26/2024 2:42:23 PM
量子位
你的生理年龄可以逆转吗?17 种 AI 算法测试洞察 22.5 万人血液样本带来新见解
伦敦国王学院的研究人员开发了一种基于 AI 的“衰老时钟”,可以通过分析血液代谢物数据预测个体的健康状况和寿命。
12/26/2024 1:44:57 PM
故渊
蚂蚁群组团最强AGI,破解几何难题完爆人类!群体智能登顶PNAS
所谓AGI,难道是「通用蚂蚁智能」,亦或是「蚂蚁通用智能」? 图片今天,无数只蚂蚁在搬运T形物体,成功穿越迷宫的视频火遍全网。 图片网友纷纷惊呼,「这简直太疯狂了。
12/26/2024 12:59:06 PM
新智元
英国拟试用全球首个 AI 工具评估糖尿病风险:提前 10 年识别潜在患者
据英国《卫报》当地时间23日报道,英国国民医疗服务体系(NHS)将启动全球首个人工智能试验,使用一款“变革性”工具,提前十多年识别出有可能患上2型糖尿病的患者。
12/26/2024 12:40:08 PM
清源
微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora
Sora、Genie等模型会都用到的Tokenizer,微软下手了——开源了一套全能的Video Tokenizer,名为VidTok。 Sora等视频生成模型工作中,都会利用Tokenizer将原始的高维视频数据(如图像和视频帧)转换为更为紧凑的视觉Token,再以视觉Token为目标训练生成模型。 而最新的VidTok,在连续和离散、不同压缩率等多种设定下,各项指标均显著优于SOTA模型。
12/26/2024 11:48:27 AM
英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了
英伟达老黄,成了今年的圣诞老黄。 AI芯片大礼包刚刚曝光:GPU新核弹B300,以及附带CPU的超级芯片GB300。 高算力,在产品层面上相比B200在FLOPS上提高50%大显存,从192GB提升到288GB,也是提高了50%。
12/26/2024 11:45:48 AM
o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型
o3在超难推理任务ARC-AGI上的成绩,属实给人类带来了不少震撼。 但有人专门研究了它不会做的题之后,有了更有趣的发现——o3之所以不会做这些题,原因可能不是因为太难,而是题目的规模太大了。 来自英国的ML工程师Mikel Bober-Irizar(不妨叫他米哥),对ARC题目进行了细致观察。
12/26/2024 11:42:56 AM
消息称小米正搭建 GPU 万卡集群,将大力投入 AI 大模型
知情人士表示,该计划已经施行数月之久,雷军在其中扮演了重要的领导角色。“在AI硬件这件事情上,最核心的是手机而不是眼镜,小米在这个领域不‘all in’是不可能的。”
12/26/2024 11:10:38 AM
清源
广汽集团发布第三代具身智能人形机器人 GoMate,预计 2026 年量产
在今日举行的 2024 年中国机器人网年会上,广汽集团正式发布了其第三代具身智能人形机器人 ——GoMate。
12/26/2024 10:42:16 AM
远洋
超节点算力集群创新联合体成立:中国移动、浪潮、阿里云等参与,打造 GPU 卡间互联体系
“超节点算力集群创新联合体”的 GPU 卡间互联是基于中国移动原创的 OISA(全向智感互联)协议所构建,OISA 旨在打造一个高效、智能、灵活且开放的 GPU 卡间互联体系,该架构致力于支持大模型训练、推理、高性能计算等数据密集型的 AI 应用。
12/26/2024 10:12:45 AM
汪淼
Chatbot 不是“万金油”:企业级生成式 AI 如何真正创造价值
许多组织对生成式 AI 应用常常抱有过高的期望。 他们一开始对 ChatGPT 或 Microsoft Co-Pilot 这样的技术感到兴奋,阅读了一些关于 AI 如何提升业务效率的文章后,便急于在各种场景中部署聊天机器人。 但当实际效果不如预期时,他们往往会感到失望。
12/26/2024 9:58:18 AM
追求卓越的