资讯列表

分类

标签

Groundlight 开源框架，搞定复杂的视觉推理

一直专注于让AI看懂世界的 Groundlight 研究团队，近日放大招，宣布开源了一套全新的 AI 框架!这套框架旨在攻克视觉领域的一大难题——复杂的视觉推理，让AI不仅能“看图识物”，更能像福尔摩斯一样，从图像中推理出更深层次的信息。我们都知道，现在的AI在识别猫猫狗狗方面已经炉火纯青，但要让它们理解图片背后的逻辑关系，进行更复杂的推理，就常常“卡壳”。 Groundlight 的研究人员指出，当前的视觉语言模型（VLM）在理解图像本身尚且不足的情况下，更难以完成需要深度解读的任务。

3/17/2025 3:00:00 PM

AI在线

消息称阿里云启动“T 项目”，加速下一代 AI 技术研发

《科创板日报》今日发布消息称，阿里云已启动了“T项目”，主要指面向下一代AI技术，做AI引擎、LLM（大语言模型）、多模态等未知领域探索，员工以类似项目“借调”的方式加入。

3/17/2025 2:59:43 PM

清源

联想问天WA7785a G3服务器创纪录!单机运行671B DeepSeek大模型吞吐量高达6708token/s!

联想今日宣布，旗下首款 AMD AI 大模型训练服务器——联想问天 WA7785a G3在单机部署671B（满血版） DeepSeek 大模型时，实现了高达6708token/s 的极限吞吐量，再次刷新了单台服务器运行超大规模模型性能的纪录。据介绍，此次性能突破得益于联想万全异构智算平台的强大支持。联想通过访存优化、显存优化、创新的 PCIe5.0全互联架构以及精选 SGLang 框架中的最优算子等一系列创新技术手段，对大模型从预训练、后训练到推理的全流程进行了持续优化。

3/17/2025 2:51:00 PM

AI在线

北大团队提出LIFT：将长上下文知识注入模型参数，提升大模型长文本能力

机构: 北京大学人工智能研究院北京通用人工智能研究院作者: 毛彦升徐宇飞李佳琪孟繁续杨昊桐郑子隆王希元张牧涵长文本任务是当下大模型研究的重点之一。在实际场景和应用中，普遍存在大量长序列（文本、语音、视频等），有些甚至长达百万级 tokens。扩充模型的长文本能力不仅意味着可以在上下文窗口中装入更长的文本，更是能够更好地建模文本段落间信息的长程依赖关系，增强对长文的阅读理解和推理。

3/17/2025 2:42:00 PM

机器之心

研究显示 60% 以上 AI 聊天机器人回答错误，新闻可信度遭受挑战

根据哥伦比亚新闻评论的数字新闻中心最新研究流行的 AI 搜索工具在回答问题时超过60% 的概率提供了不正确或误导性的信息。这一结果令人担忧，因为这些工具不仅削弱了公众对新闻报道的信任，也使出版商面临流量和收入的双重损失。图源备注：图片由AI生成，图片授权服务商Midjourney研究人员测试了包括 ChatGPT、Perplexity、Gemini 和 Grok 在内的八款生成式 AI 聊天机器人，要求它们识别来自200篇最新新闻文章的摘录。

3/17/2025 2:40:00 PM

AI在线

OpenAI 高管预测：AI 将于2025年底超越人类程序员

在最近的一期播客中，OpenAI 的首席产品官凯文・维尔（Kevin Weil）表示，人工智能有望在性编码基准测试中在今年底之前超越人类程序员。这一言论是在与 Avalon 首席执行官瓦伦・梅亚(Varun Mayya)和 YouTuber 坦梅・巴特(Tanmay Bhat)进行对话时提出的。凯文回顾了近年来人工智能的快速发展，强调了 AI 编码模型的显著进步。

3/17/2025 2:36:00 PM

AI在线

大模型怎么做好角色扮演？最大的真实数据集、SoTA开源模型、最深入的评估在这里

王鑫涛，复旦大学博士生，师从肖仰华、汪卫教授，致力于探索用AI创造具有人格的数字生命。研究方向聚焦大语言模型与Agent技术，在AI角色扮演领域发表多篇ACL/EMNLP论文，以及该领域首篇研究综述，总计引用量三百余次。他的研究寻求AI技术与人类情感需求的结合。

3/17/2025 2:36:00 PM

机器之心

不是CG？没加速？这个国产机器人跳「斧头帮」舞火了，网友：流畅到不像真的

机器之心报道，编辑：张倩、佳琳。

3/17/2025 2:19:00 PM

机器之心

小米大模型团队在音频推理领域取得重大突破，登顶国际评测榜

近日，小米大模型团队在音频推理领域的研究中取得了突破性进展，成功应用强化学习算法于多模态音频理解任务，准确率达到了64.5%，这一成就使其在国际权威的 MMAU 音频理解评测中夺得了第一名。这一成果的背后，离不开团队对 DeepSeek-R1的启发。 MMAU（Massive Multi-Task Audio Understanding and Reasoning）评测集是衡量音频推理能力的重要标准，通过对包含语音、环境声和音乐的多种音频样本进行分析，测试模型在复杂推理任务中的表现。

3/17/2025 2:13:00 PM

AI在线

李开复推出万智企业大模型平台，强调大模型竞争新方向

在中国人工智能领域的不断演进中，李开复创办的 AI 公司 “零一万物” 于2025年3月17日宣布推出其全新的万智企业大模型一站式平台。该平台旨在为企业提供定制化的 DeepSeek 部署解决方案，助力企业高效应用大模型技术。万智企业大模型一站式平台预装了多款高性能 GPU，如昇腾等，内置 DeepSeek 全系列模型，灵活支持前沿的 AI 模型架构，满足企业在搜索和数据处理上的需求。

3/17/2025 2:00:00 PM

AI在线

钉钉推出AI客服助理可自动接入企业官网、公众号等平台

2025年3月17日，钉钉宣布推出一项重磅AI能力——AI客服助理，该功能可自动接入企业官网、公众号等平台，直接服务消费者和企业客户。这一创新举措一经推出便受到企业客户的广泛欢迎，目前已有包括云深处科技、Rokid（乐奇）、瑞德林、艾为电子、精准学等在内的700多家企业接入使用。钉钉AI客服助理通过多轮对话能够精准理解用户的真实需求，并有效回复复杂问题，如“产品参数对比”等深度咨询内容。

3/17/2025 1:54:00 PM

AI在线

2025年99%代码AI生成！OpenAI高管宣告没有退路，人类将被全面超越

「2025年底，99%的编码将实现AI自动化」！图片这是OpenAI首席产品官Kevin Weil在最新一期采访中，向全世界发出的郑重宣告。他大胆预测，今年是人工智能在编程方面，永远超越人类的一年，我们已经没有退路了。

3/17/2025 1:51:06 PM

新智元

提前免费！百度一口气上线文心4.5和X1!实力震惊硅谷！API价格又打下来了，R1还得对半砍！实测首款“有工具箱”的推理模型！

编辑 |伊风、言征出品 | 51CTO技术栈（微信号：blog51cto）百度的步伐也是加速了！原本计划4月1日免费的文心大模型4.5，在两周年之际就提前登场。不仅如此，3月16日，百度搞了个“两连发”，一口气开放了两款模型文心大模型4.5和文心大模型X1。

3/17/2025 1:45:25 PM

伊风

https://mp.weixin.qq.com/s/-lOj5naC2Yb3BD32YuUyOw

3/17/2025 12:55:18 PM

机器之心

RAG（四）Adaptive Retrieval --语言模型的信任边界，参数与非参数记忆的有效性研究

大语言模型（LMs）在许多自然语言处理任务上表现优异，但它们在记忆和回忆不太常见或不流行的事实知识方面存在明显的局限性。并且，当涉及到长尾实体（即那些在网络上讨论较少、出现频率较低的实体）的问题时，LMs 的性能显著下降，并且增加模型规模并不能有效地解决这一问题。此外，LMs 对于自身知识边界的认识有限，有时会产生幻觉，即生成看似合理但实际上错误的信息。

3/17/2025 12:52:44 PM

Glodma

真正的AI智能体时代即将到来，我们发现了几点「苦涩的教训」

最近一段时间，智能体（Agent）再次成为 AI 领域热议的焦点。 2025 年 1 月，OpenAI 发布了名为 DeepResearch 的 o3 模型变种，专门用于网页和文档搜索。得益于在浏览任务上的强化学习训练，DeepResearch 具备了制定搜索策略、交叉引用信息来源、甚至利用中间反馈来处理深层次知识的能力。

3/17/2025 12:52:00 PM

机器之心

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

7B小模型 3.8万条训练数据，就能让音频理解和推断评测基准MMAU榜单王座易主？受到DeepSeek-R1中强化学习算法的启发，小米大模型团队对阿里的Qwen2-Audio-7B模型进行了微调。结果模型在MMAU上的准确率从49.2%提升到了64.5%（涨幅31%），比以前霸榜的GPT-4o还高出近10个百分点。

3/17/2025 12:13:26 PM

量子位

小米大模型团队登顶音频推理 MMAU 榜，受到DeepSeek-R1启发

小米技术官方微博宣布，小米大模型团队在音频推理领域取得了显著进展。他们在受到 DeepSeek-R1的启发后，率先将强化学习算法应用于多模态音频理解任务。团队在短短一周内便以64.5% 的 SOTA（State Of The Art）准确率，登顶国际权威的 MMAU 音频理解评测榜，并同步将相关技术开源。

3/17/2025 11:43:00 AM

AI在线

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 Figma 推 AI 革命：开发智能应用制作器与网站创建工具 Midjourney图像编辑器迎来重大更新：全新UI、图层功能与智能工具上线别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora Anthropic AI for Science 3D AI设计机器学习 GPU 开发者场景华为预测人形机器人伟达 Transformer 百度深度学习苹果 AI视频模态 xAI 字节跳动驾驶文本搜索大语言模型 Claude 具身智能 Copilot 神器推荐 LLaMA 算力安全应用视频生成视觉科技亚马逊大型语言模型干货合集特斯拉 2024 AGI 训练

资讯列表

Groundlight 开源框架，搞定复杂的视觉推理

消息称阿里云启动“T 项目”，加速下一代 AI 技术研发

联想问天WA7785a G3服务器创纪录!单机运行671B DeepSeek大模型吞吐量高达6708token/s!

北大团队提出LIFT：将长上下文知识注入模型参数，提升大模型长文本能力

​研究显示 60% 以上 AI 聊天机器人回答错误，新闻可信度遭受挑战

​OpenAI 高管预测：AI 将于2025年底超越人类程序员

大模型怎么做好角色扮演？最大的真实数据集、SoTA开源模型、最深入的评估在这里

不是CG？没加速？这个国产机器人跳「斧头帮」舞火了，网友：流畅到不像真的

小米大模型团队在音频推理领域取得重大突破，登顶国际评测榜

李开复推出万智企业大模型平台，强调大模型竞争新方向

钉钉推出AI客服助理 可自动接入企业官网、公众号等平台

2025年99%代码AI生成！OpenAI高管宣告没有退路，人类将被全面超越

提前免费！百度一口气上线文心4.5和X1!实力震惊硅谷！API价格又打下来了，R1还得对半砍！实测首款“有工具箱”的推理模型！

https://mp.weixin.qq.com/s/-lOj5naC2Yb3BD32YuUyOw

RAG（四）Adaptive Retrieval --语言模型的信任边界，参数与非参数记忆的有效性研究

真正的AI智能体时代即将到来，我们发现了几点「苦涩的教训」

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

小米大模型团队登顶音频推理 MMAU 榜，受到DeepSeek-R1启发

研究显示 60% 以上 AI 聊天机器人回答错误，新闻可信度遭受挑战

OpenAI 高管预测：AI 将于2025年底超越人类程序员

钉钉推出AI客服助理可自动接入企业官网、公众号等平台