AI

让模型预见数据分布变化，东京大学等提出时态域泛化全新框架
在数据分布持续变化的动态环境中，如何进行连续模型泛化？东京大学等高校的研究人员提出了名为Koodos的新框架，可以基于在一些随机时间点观测的数据分布，在任意时刻生成当下适用的神经网络。尽管数据随时间持续发生变化，但是泛化的模型能在连续时间中与数据分布始终保持协调一致。
理论
- 969
- 0
量子位11月21日
AI版《黑客帝国》：无限生成逼真视频，3A画质，还能实时交互
人类离电影《黑客帝国》的场景，似乎又近了一步。因为就在刚刚，一个与电影同名的、首个AI基础世界模拟器——The Matrix问世。它已经可以实现生成无限长、高保真720p真实场景视频，而且还是可以实时交互的那种！
理论
- 969
- 0
量子位11月21日
国产模型指令跟随全球第一！来自LeCun亲推的「最难作弊」大模型新榜单
？？一直低调行事的国内初创公司，旗下模型悄悄地跃升成国内第一、世界第五（仅排在o1系列和Claude 3.5之后）！
理论
- 969
- 0
量子位11月21日
前端已经进化到这种程度了吗？
近年来，AI 技术的迅猛发展催生了众多高效能的 AI 开发工具，极大地加速了开发进程。与此同时，浏览器技术亦在持续演进，其中Chrome 浏览器也在逐步融入多项 AI 功能，显著提升了开发、调试体验。本文将简要介绍几款热门的 AI 开发工具，并深入探讨 Chrome 浏览器在 AI 领域的最新进展！
理论
- 970
- 0
CUGGZ11月21日
三星多模态 AI 模型 Gauss 2 登场，赋能 Galaxy 智能生态
三星公司今天（10 月 21 日）发布博文，在韩国举办的开发者大会上，宣布推出第二代生成式 AI 模型 Samsung Gauss2。
应用
- 969
- 0
故渊11月21日
一个AI浣熊账号的高开癫走：仅靠82篇帖子、4个月涨粉近14万！
AI好好用报道编辑：Sia以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。
应用
- 971
- 0
AI好好用11月21日
无卷积骨干网络：金字塔Transformer，提升目标检测/分割等任务精度（附源代码）
论文地址：：，最近还激发了Transformer式架构设计的出现，并在众多计算机视觉任务中取得了具有竞争力的结果。如下是之前我们分享的基于Transformer的目标检测新技术！链接：ResNet超强变体：京东AI新开源的计算机视觉模块！
理论
- 970
- 0
计算机视觉研究院11月21日
欧洲央行警告：人工智能相关股票存在“泡沫”突然破裂风险
欧洲央行警告称，人工智能相关股票存在“泡沫”风险，如果投资者乐观预期落空，泡沫可能突然破裂。
应用
- 969
- 0
远洋11月20日
“乐坛 ChatGPT”歌曲生成平台 Suno 发布 v4 版本，引入 AI 歌词生成助手
此次更新在音质、歌词精准度以及歌曲结构方面带来了显著提升。官方表示，与之前的版本相比，v4 提供了更清晰的音频、更锐利的歌词以及更具动感的作品。
应用
- 970
- 0
清源11月20日
昆仑万维推出“天工大模型 4.0”4o 版及实时语音助手 Skyo，号称可克服大模型幻觉
今天上午，昆仑万维宣布推出“天工大模型4.0”4o版（Skywork 4o）以及新产品“实时语音对话助手Skyo”。
应用
- 970
- 0
清源11月20日
九大成像模式一键解析，生物医学图像AI再迎突破！微软、UW等BiomedParse登Nature子刊
作者 | BiomedParse团队编辑 | ScienceAI生物医学图像解析在癌症诊断、免疫治疗和疾病进展监测中至关重要。然而，不同的成像模式（如MRI、CT和病理学）通常需要单独的模型，造成资源浪费和效率低下，未能充分利用模式间的共性知识。微软团队最新发布的基础模型BiomedParse，开创性地通过文本驱动图像解析将九种成像模式整合于一个统一的模型中，通过联合预训练处理对象识别、检测与…
理论
- 981
- 0
ScienceAI11月20日
利用 YOLO11 做停车管理
对于繁忙的城市和公共场所来说，有效管理停车至关重要。传统方法常常跟不上需求，导致拥堵和挫败感。随着人工智能的进步，我们现在有了YOLO，这是一个强大的目标检测工具，可以用来改进停车管理系统。
理论
- 970
- 0
二旺11月20日
iPad可用AI绘画交互编辑神器火了，网友：颤抖吧PS
比PS更懂你的AI图片编辑工具——MagicQuill（魔法羽毛）来了！ 1分钟出图：不用打字、简单勾画几笔就能编辑图片。还支持直接在iPad上在线编辑！
理论
- 969
- 0
量子位11月20日
人生搜索引擎免费用，开源版哈利波特“冥想盆”登GitHub热榜，支持中文
天啦撸！回溯你在网上看过、做过的一切，也有免费软件可用了！简单说，针对任何“之前好像在哪看过”的电脑文件，只需输入相关搜索词，这个软件都能帮你一键轻松回忆了。
理论
- 969
- 0
量子位11月20日
谷歌 Gemini 引入“记忆”功能：AI 记住用户偏好、习惯，提供更贴心服务
科技媒体 TechCrunch 昨日（11 月 19 日）发布博文，报道称谷歌开始向 Gemini Advanced 用户，推出“记忆”（memory）功能，可以记住用户的生活细节、工作习惯以及个人偏好。
应用
- 970
- 0
故渊11月20日
德国科学家激进观点：意识是虚拟的，存在于大脑构建的梦中
AI 能否拥有意识？针对这个问题，大家已经争论了很多年。「我认为，从物理学的角度来说（如果物理学是正确的），我们的宇宙诞生之初几乎只有氢。
理论
- 970
- 0
机器之心11月20日
室温超导学术不端、多次Nature撤稿，这位印度裔学者被大学解雇
刚刚，纽约罗切斯特大学印度裔物理学家 Ranga Dias 的调查结果已经出来了，终止 Dias 在该学校的职位。 Ranga Dias罗彻斯特大学发言人在给《华尔街日报》的一份声明中证实，Dias 不再是罗彻斯特大学的员工，也不再从事与大学有关的任何研究活动，他已被解雇，「在过去的一年里，该大学完成了一项公正而彻底的调查 —— 由一个国内外知名物理学家组成的小组进行 —— 调查了 Dias 作为…
理论
- 970
- 0
机器之心11月20日
Transformer为什么一定要添加一个Positional Encoding模块？
之前老喜欢死记硬背transformer的网络架构，虽然内容并不复杂，但是发现这个transformer模块中的positional encoding在死记硬背的情况之下很容易被忽略。为了更好地理解为什么transformer一定需要有一个positional encoding，简单推了一下公式先说结论：没有Positional Encoding的transformer架构具有置换等变性。证明…
理论
- 971
- 0
Sirius11月20日
Mamba与元学习双管齐下，打造新的语义补全方案！
本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面 && 笔者理解传统的自动驾驶框架下，现有感知而后又规控，所以可以说感知在这套框架下扮演着非常基础性的工作。然而，动态交通参与者的突发性和可变性，加上静态对象的较大的范围和距离，给自动驾驶车辆在感知复杂驾驶场景时带来了不小的挑战。
理论
- 969
- 0
Yansong Qu等11月20日
AI自动操作VS Code，自然语言搞定各种配置，来自阿里通义智能计算实验室 | 开源
国产AI已经学会直接操纵编程软件了！阿里通义智能计算实验室在推出了一款专门针对VSCode的AI助手工具——SmartVscode。通过自然语言指令，不仅可以让它帮你编程，还能搞定各种配置的控制和修改。
理论
- 983
- 0
量子位11月20日
Qwen2.5更新百万超长上下文，推理速度4.3倍加速，网友：RAG要过时了
国产大模型，最近有点卷。这不，刚在写代码这事儿上刷新SOTA，Qwen2.5系列又双叒突然更新了——一口气读三本《三体》不费事，并且45秒左右就能完整总结出这69万token的主要内容，be like：还真不是糊弄事儿，“大海捞针”实验显示，这个全新的Qwen2.5-Turbo在100万token上下文中有全绿的表现。也就是说，这100万上下文里，有细节Qwen2.5-Turbo是真能100%…
理论
- 970
- 0
量子位11月20日
初创公司 Friend 预热人工智能吊坠硬件，上线对话平台可先行与 AI 聊天
初创公司 Friend 现预热一款 Friend AI 吊坠硬件，该硬件可以挂在用户脖子上，通过内置的麦克风和扬声器与用户进行对话，不过IT之家注意到 Friend 公司尚未公布这款硬件的具体规格。
应用
- 968
- 0
漾仔11月19日
机器教学入门指南
什么是机器教学?尽管人工智能(AI)已在许多行业得到广泛应用，但根据麻省理工学院斯隆管理学院的研究，只有不到10%的采用人工智能的企业真正实现了预期的商业收益。要从人工智能中真正获益，企业必须找到将人类与机器紧密结合的方式，这一概念被称为“组织学习”。具体而言，许多企业在初期应用人工智能时，通常会选择那些已经具备大量可用数据且容易训练模型的低难度场景，比如客户支持分流、社交媒体情感分析以及市场…
理论
- 968
- 0
Thoughtworks洞见11月19日
Mistral 发布 Pixtral Large 多模态 AI 模型：登顶复杂数学推理，图表 / 文档推理超过 GPT-4o
Mistral AI 公司昨日（11 月 18 日）发布公告，宣布了全新的多模态 AI 模型 Pixtral Large。该模型拥有 1240 亿参数，基于 Mistral Large 2，主要用于处理文本和图片。
应用
- 970
- 0
故渊11月19日