资讯列表
Groundlight 开源框架,搞定复杂的视觉推理
一直专注于让AI看懂世界的 Groundlight 研究团队,近日放大招,宣布开源了一套全新的 AI 框架!这套框架旨在攻克视觉领域的一大难题——复杂的视觉推理,让AI不仅能“看图识物”,更能像福尔摩斯一样,从图像中推理出更深层次的信息。 我们都知道,现在的AI在识别猫猫狗狗方面已经炉火纯青,但要让它们理解图片背后的逻辑关系,进行更复杂的推理,就常常“卡壳”。 Groundlight 的研究人员指出,当前的视觉语言模型 (VLM) 在理解图像本身尚且不足的情况下,更难以完成需要深度解读的任务。
3/17/2025 3:00:00 PM
AI在线
消息称阿里云启动“T 项目”,加速下一代 AI 技术研发
《科创板日报》今日发布消息称,阿里云已启动了“T项目”,主要指面向下一代AI技术,做AI引擎、LLM(大语言模型)、多模态等未知领域探索,员工以类似项目“借调”的方式加入。
3/17/2025 2:59:43 PM
清源
联想问天WA7785a G3服务器创纪录!单机运行671B DeepSeek大模型吞吐量高达6708token/s!
联想今日宣布,旗下首款 AMD AI 大模型训练服务器——联想问天 WA7785a G3在单机部署671B(满血版) DeepSeek 大模型时,实现了高达6708token/s 的极限吞吐量,再次刷新了单台服务器运行超大规模模型性能的纪录。 据介绍,此次性能突破得益于联想万全异构智算平台的强大支持。 联想通过访存优化、显存优化、创新的 PCIe5.0全互联架构以及精选 SGLang 框架中的最优算子等一系列创新技术手段,对大模型从预训练、后训练到推理的全流程进行了持续优化。
3/17/2025 2:51:00 PM
AI在线
北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力
机构: 北京大学人工智能研究院 北京通用人工智能研究院作者: 毛彦升 徐宇飞 李佳琪 孟繁续 杨昊桐 郑子隆 王希元 张牧涵长文本任务是当下大模型研究的重点之一。 在实际场景和应用中,普遍存在大量长序列(文本、语音、视频等),有些甚至长达百万级 tokens。 扩充模型的长文本能力不仅意味着可以在上下文窗口中装入更长的文本,更是能够更好地建模文本段落间信息的长程依赖关系,增强对长文的阅读理解和推理。
3/17/2025 2:42:00 PM
机器之心
研究显示 60% 以上 AI 聊天机器人回答错误,新闻可信度遭受挑战
根据哥伦比亚新闻评论的数字新闻中心最新研究流行的 AI 搜索工具在回答问题时超过60% 的概率提供了不正确或误导性的信息。 这一结果令人担忧,因为这些工具不仅削弱了公众对新闻报道的信任,也使出版商面临流量和收入的双重损失。 图源备注:图片由AI生成,图片授权服务商Midjourney研究人员测试了包括 ChatGPT、Perplexity、Gemini 和 Grok 在内的八款生成式 AI 聊天机器人,要求它们识别来自200篇最新新闻文章的摘录。
3/17/2025 2:40:00 PM
AI在线
OpenAI 高管预测:AI 将于2025年底超越人类程序员
在最近的一期播客中,OpenAI 的首席产品官凯文・维尔(Kevin Weil)表示,人工智能有望在性编码基准测试中在今年底之前超越人类程序员。 这一言论是在与 Avalon 首席执行官瓦伦・梅亚(Varun Mayya)和 YouTuber 坦梅・巴特(Tanmay Bhat)进行对话时提出的。 凯文回顾了近年来人工智能的快速发展,强调了 AI 编码模型的显著进步。
3/17/2025 2:36:00 PM
AI在线
大模型怎么做好角色扮演?最大的真实数据集、SoTA开源模型、最深入的评估在这里
王鑫涛,复旦大学博士生,师从肖仰华、汪卫教授,致力于探索用AI创造具有人格的数字生命。 研究方向聚焦大语言模型与Agent技术,在AI角色扮演领域发表多篇ACL/EMNLP论文,以及该领域首篇研究综述,总计引用量三百余次。 他的研究寻求AI技术与人类情感需求的结合。
3/17/2025 2:36:00 PM
机器之心
小米大模型团队在音频推理领域取得重大突破,登顶国际评测榜
近日,小米大模型团队在音频推理领域的研究中取得了突破性进展,成功应用强化学习算法于多模态音频理解任务,准确率达到了64.5%,这一成就使其在国际权威的 MMAU 音频理解评测中夺得了第一名。 这一成果的背后,离不开团队对 DeepSeek-R1的启发。 MMAU(Massive Multi-Task Audio Understanding and Reasoning)评测集是衡量音频推理能力的重要标准,通过对包含语音、环境声和音乐的多种音频样本进行分析,测试模型在复杂推理任务中的表现。
3/17/2025 2:13:00 PM
AI在线
李开复推出万智企业大模型平台,强调大模型竞争新方向
在中国人工智能领域的不断演进中,李开复创办的 AI 公司 “零一万物” 于2025年3月17日宣布推出其全新的万智企业大模型一站式平台。 该平台旨在为企业提供定制化的 DeepSeek 部署解决方案,助力企业高效应用大模型技术。 万智企业大模型一站式平台预装了多款高性能 GPU,如昇腾等,内置 DeepSeek 全系列模型,灵活支持前沿的 AI 模型架构,满足企业在搜索和数据处理上的需求。
3/17/2025 2:00:00 PM
AI在线
钉钉推出AI客服助理 可自动接入企业官网、公众号等平台
2025年3月17日,钉钉宣布推出一项重磅AI能力——AI客服助理,该功能可自动接入企业官网、公众号等平台,直接服务消费者和企业客户。 这一创新举措一经推出便受到企业客户的广泛欢迎,目前已有包括云深处科技、Rokid(乐奇)、瑞德林、艾为电子、精准学等在内的700多家企业接入使用。 钉钉AI客服助理通过多轮对话能够精准理解用户的真实需求,并有效回复复杂问题,如“产品参数对比”等深度咨询内容。
3/17/2025 1:54:00 PM
AI在线
2025年99%代码AI生成!OpenAI高管宣告没有退路,人类将被全面超越
「2025年底,99%的编码将实现AI自动化」! 图片这是OpenAI首席产品官Kevin Weil在最新一期采访中,向全世界发出的郑重宣告。 他大胆预测,今年是人工智能在编程方面,永远超越人类的一年,我们已经没有退路了。
3/17/2025 1:51:06 PM
新智元
提前免费!百度一口气上线文心4.5和X1!实力震惊硅谷!API价格又打下来了,R1还得对半砍!实测首款“有工具箱”的推理模型!
编辑 |伊风、言征出品 | 51CTO技术栈(微信号:blog51cto)百度的步伐也是加速了! 原本计划4月1日免费的文心大模型4.5,在两周年之际就提前登场。 不仅如此,3月16日,百度搞了个“两连发”,一口气开放了两款模型文心大模型4.5和文心大模型X1。
3/17/2025 1:45:25 PM
伊风
https://mp.weixin.qq.com/s/-lOj5naC2Yb3BD32YuUyOw
机构: 北京大学人工智能研究院 北京通用人工智能研究院作者: 毛彦升 徐宇飞 李佳琪 孟繁续 杨昊桐 郑子隆 王希元 张牧涵长文本任务是当下大模型研究的重点之一。 在实际场景和应用中,普遍存在大量长序列(文本、语音、视频等),有些甚至长达百万级 tokens。 扩充模型的长文本能力不仅意味着可以在上下文窗口中装入更长的文本,更是能够更好地建模文本段落间信息的长程依赖关系,增强对长文的阅读理解和推理。
3/17/2025 12:55:18 PM
机器之心
RAG(四)Adaptive Retrieval --语言模型的信任边界,参数与非参数记忆的有效性研究
大语言模型(LMs)在许多自然语言处理任务上表现优异,但它们在记忆和回忆不太常见或不流行的事实知识方面存在明显的局限性。 并且,当涉及到长尾实体(即那些在网络上讨论较少、出现频率较低的实体)的问题时,LMs 的性能显著下降,并且增加模型规模并不能有效地解决这一问题。 此外,LMs 对于自身知识边界的认识有限,有时会产生幻觉,即生成看似合理但实际上错误的信息。
3/17/2025 12:52:44 PM
Glodma
真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」
最近一段时间,智能体(Agent)再次成为 AI 领域热议的焦点。 2025 年 1 月,OpenAI 发布了名为 DeepResearch 的 o3 模型变种,专门用于网页和文档搜索。 得益于在浏览任务上的强化学习训练,DeepResearch 具备了制定搜索策略、交叉引用信息来源、甚至利用中间反馈来处理深层次知识的能力。
3/17/2025 12:52:00 PM
机器之心
迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单
7B小模型 3.8万条训练数据,就能让音频理解和推断评测基准MMAU榜单王座易主? 受到DeepSeek-R1中强化学习算法的启发,小米大模型团队对阿里的Qwen2-Audio-7B模型进行了微调。 结果模型在MMAU上的准确率从49.2%提升到了64.5%(涨幅31%),比以前霸榜的GPT-4o还高出近10个百分点。
3/17/2025 12:13:26 PM
量子位
小米大模型团队登顶音频推理 MMAU 榜,受到DeepSeek-R1启发
小米技术官方微博宣布,小米大模型团队在音频推理领域取得了显著进展。 他们在受到 DeepSeek-R1的启发后,率先将强化学习算法应用于多模态音频理解任务。 团队在短短一周内便以64.5% 的 SOTA(State Of The Art)准确率,登顶国际权威的 MMAU 音频理解评测榜,并同步将相关技术开源。
3/17/2025 11:43:00 AM
AI在线