资讯列表
阿里 QwQ-32B 大模型集成至国家超算互联网平台 Chatbot 可视化对话 / API 在线调用服务
国家超算互联网平台今日发文宣布 MaaS 服务再上新:QwQ-32B 推理大模型正式集成至 Chatbot 可视化对话服务与 API 在线调用服务。
3/17/2025 7:32:12 PM
归泷(实习)
摩尔线程开源 MT-MegatronLM 和 MT-TransformerEngine 两大 AI 框架
摩尔线程官方今日发文宣布,近日已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU 上实现高效的混合并行训练和推理,提升了训练效率与稳定性。
3/17/2025 6:28:02 PM
归泷(实习)
ChatGPT Android 测试版(1.2025.070)上线:可设置为手机默认数字助理,替代谷歌 Gemini
在通过长按 Home 按键、导航条或长按电源键唤醒数字助理后,屏幕上会出现 ChatGPT 的悬浮气泡。
3/17/2025 6:08:50 PM
潞源(实习)
浙江: 2025 年新增直播相关企业 1000 家、促进“人工智能+消费”
浙江省人民政府办公厅印发了关于大力提振和扩大消费专项行动实施方案的通知,实施提振消费专项行动,力争2025年社会消费品零售总额增长5%以上。 专项行动实施方案提出,积极发展直播电商、即时零售、社区团购、兴趣电商等新型消费业态,2025年新增直播相关企业1000家、培育“绿色直播间”300个。 焕新历史经典、中华老字号产品,促进“人工智能 消费”。
3/17/2025 5:59:00 PM
AI在线
想与顶级AI人才互动?来和机器之心一起共赴这4场全球学术顶会
时间的脚步来到 2025 年,人工智能领域依旧风起云涌。 从春节前火遍全球的 DeepSeek 开始,2025 年的中国 AI 力量展现出了以颠覆性技术创新引领全球浪潮的趋势。 DeepSeek 专注语言基座与多模态兼容,凭借开源普惠的路径和低成本高性能的突破,推动 AI 应用从「概念验证」迈向「规模化落地」。
3/17/2025 5:46:00 PM
机器之心
ICLR 2025 | 四川大学提出Test-time Adaptation新范式,突破查询偏移挑战
在 NeurIPS 2024 大会上,OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 在其主题报告中展望了基础模型的未来研究方向,其中包括了 Inference Time Compute [1],即增强模型在推理阶段的能力,这也是 OpenAI o1 和 o3 等核心项目的关键技术路径。 作为 Inference Time Compute 的重要方向之一,Test-time Adaptation(TTA)旨在使预训练模型动态适应推理阶段中不同分布类型的数据,能够有效提高神经网络模型的分布外泛化能力。 然而,当前 TTA 的应用场景仍存在较大局限性,主要集中在单模态任务中,如识别、分割等领域。
3/17/2025 5:43:00 PM
机器之心
游戏新势力:Liminal Experiences 利用 AI 打造用户生成内容
随着 5.8 百万美元的资金注入,位于洛杉矶的游戏初创公司 Liminal Experiences Inc. 于周二正式亮相,致力于将用户生成内容引入视频游戏。 该公司由曾在 Riot Games 工作的布兰登・穆利根创立,旨在通过人工智能工具帮助用户构建自己的角色扮演类视频游戏,创建独特的角色、环境和故事情节。
3/17/2025 4:58:00 PM
AI在线
报道称阿里云全新 “T 项目” 启动,推进下一代 AI 技术研发
据《科创板日报》,阿里云启动了名为 “T 项目” 的新计划,旨在加速下一代 AI 技术的研发。 该项目将专注于多个前沿领域,包括 AI 引擎、大型语言模型(LLM)和多模态技术等,期望通过这些技术的突破,满足日益增长的市场需求。 “T 项目” 的启动意味着阿里云在 AI 领域布局的进一步加深。
3/17/2025 4:47:00 PM
AI在线
米哈游创始人新 AI 游戏《群星低语》内测开启,带你与 AI 女友共同求生
近日,米哈游创始人蔡浩宇所创办的神秘 AI 游戏公司 Anuttacon 推出了新作《群星低语》(Whispers From The Star),该游戏以科幻主题为背景,结合了先进的 AI 技术,给玩家带来了独特的互动体验。 与传统叙事游戏不同,《群星低语》通过实时对话,让玩家的选择直接影响游戏进程和角色命运。 在游戏中,玩家将扮演一名天体物理系的女生 Stella,她是外星星球 GAIA 上的唯一幸存者。
3/17/2025 4:43:00 PM
AI在线
FF成立Future AIHER子公司,全面布局AI混增电驱系统领域
法拉第未来(Faraday Future,简称FF)近日在洛杉矶总部成功举办了首届FF Open AI Day,重点展示了公司的AI战略、产品及技术规划。 会上,FF宣布正式成立全球首家AI混增电驱系统公司——Future AIHER Inc.,这家全资子公司将专注于超级AI混增系统和超级AI增程系统的设计与开发,为增程式电动车(EREV)提供全面动力解决方案。 超级AI混增(AIHER)技术被描述为AI驱动的"增程 混动"、"强增程,弱混动"的融合技术。
3/17/2025 4:40:00 PM
AI在线
钉钉推出 AI 客服助理,宣称 700 家企业已接入
钉钉官方今日宣布推出 AI 客服助理,其支持自动接入企业官网、公众号,直接服务消费者和企业客户。官方称这项能力一经推出后,云深处科技、Rokid(乐奇)、瑞德林、艾为电子、精准学等 700 多家企业已接入。
3/17/2025 4:28:45 PM
归泷(实习)
搜狗输入法PC版「AI助手」接入满血版「腾讯元宝」
腾讯搜狗输入法宣布其PC版「AI助手」正式接入满血版「腾讯元宝」大模型能力,为用户带来更便捷的AI体验。 此次升级无需额外下载AI软件,用户即可在键盘上直接体验腾讯混元和DeepSeek大模型的强大功能,支持「深度思考」和「联网搜索」,助力办公和学习效率大幅提升。 用户只需将PC版搜狗输入法升级至最新版本,点击状态栏的「汪仔」按钮或通过「Alt 空格」快捷键,即可召唤出AI助手。
3/17/2025 4:02:00 PM
AI在线
突发!百川智能两位联合创始人出走,一位正在走离职手续
出品 | 51CTO技术栈(微信号:blog51cto)刚刚收到消息,大模型六小虎之一的百川智能高层出现了很大的变动——两位联合创始人被媒体曝出了离职创业的消息。 其中,联合创始人焦可已经离职,另一位联合创始人陈炜鹏也将离职,目前还在走内部流程。 另据知情人士称,焦可和陈炜鹏两人都已经分别开始AI领域的创业。
3/17/2025 3:59:19 PM
北大团队提出全新框架LIFT 将长上下文知识注入模型参数
北京大学张牧涵团队提出了一种全新的框架——Long Input Fine-Tuning (LIFT),通过将长输入文本训练进模型参数中,使任意短上下文窗口模型获得长文本处理能力。 这一方法颠覆了传统的长文本处理思路,不再专注于无限扩充上下文窗口,而是将长文本知识内化到模型参数中,类似于人类将工作记忆转化为长期记忆的过程。 目前大模型处理长文本面临两大主要挑战:传统注意力机制的平方复杂度导致处理长文本时计算和内存开销巨大 模型难以理解散落在长文本各处的长程依赖关系现有的解决方案如RAG和长上下文适配各有局限:RAG依赖准确的检索,容易引入噪声导致幻觉 长上下文适配的推理复杂度高,上下文窗口仍然有限LIFT的技术创新LIFT框架包含三个关键组件:动态高效的长输入训练通过分段的语言建模将长文本切分为有重叠的片段 避免因过长上下文造成的推理复杂度提升和长程依赖丢失 训练复杂度对长文本长度呈线性增长 平衡模型能力的门控记忆适配器设计专门的Gated Memory Adapter架构 动态平衡原始模型的In-Context Learning能力和对长输入的记忆理解 允许模型根据查询自动调节使用多少LIFT记忆的内容辅助任务训练通过预训练LLM基于长文本自动生成问答类辅助任务 补偿模型在切段训练中可能损失的能力 帮助模型学会应用长文本中的信息回答问题实验结果LIFT在多个长上下文基准测试上取得显著提升:LooGLE长依赖问答:Llama38B的正确率从15.44%提升至29.97% LooGLE短依赖问答:Gemma29B的正确率从37.37%提升至50.33% LongBench多项子任务:Llama3通过LIFT在5个子任务中的4个有明显提升消融实验表明,Gated Memory架构相比使用PiSSA微调的原模型,在LooGLE ShortQA数据集上的GPT-4score提升了5.48%。
3/17/2025 3:59:00 PM
AI在线
上海市出台 AI 行业鼓励政策,每年设立一定规模算力券、模型券、语料券供企业使用
上海市发布新政策,每年设立算力券、模型券、语料券,支持AI企业发展。此举旨在降低企业成本,促进产业集聚。 #上海AI政策# #人工智能#
3/17/2025 3:41:57 PM
漾仔
百川智能联合创始人焦可、陈炜鹏相继离职,投身AI创业热潮
近日,据界面报道,AI独角兽百川智能联合创始人焦可已正式离职,而另一位联合创始人陈炜鹏也将离开,目前仍在办理内部离职手续。 这一消息引发业内广泛关注。 据知情人士透露,焦可已开启AI语音领域的创业项目,并积极寻求融资支持。
3/17/2025 3:23:00 PM
AI在线
Anthropic或将发布Claude3.7Sonnet Max?Cursor更新引发猜测
近日,AI代码编辑器Cursor在其最新版本0.47.5的更新日志中透露,正在为Anthropic即将推出的“Claude3.7Sonnet Max”模型做准备。 这一消息迅速引发业内关注。 然而,目前Anthropic尚未发布任何官方公告,关于“Claude3.7Sonnet Max”的具体信息仍是个谜。
3/17/2025 3:14:00 PM
AI在线
无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025
编辑丨ScienceAI在药物研发和材料科学领域,设计具有特定性质的分子是一项关键但耗时的任务。 传统方法依赖大量实验试错,而生成式 AI 模型的出现为这一领域带来曙光。 然而,现有方法面临两大瓶颈:一是多数生成模型仅能处理连续型数据(如图像像素),难以应对分子设计中离散的原子类型与连续坐标共存的多模态数据;二是针对特定性质的定向生成通常需要额外训练模型,成本高昂。
3/17/2025 3:08:00 PM
ScienceAI