应用
小米多模态大模型 MiMo-VL 开源,官方称多方面领先 Qwen2.5-VL-7B
官方表示,其在图片、视频、语言的通用问答和理解推理等多个任务上,大幅领先同尺寸标杆多模态模型 Qwen2.5-VL-7B,并且在 GUI Grounding 任务上比肩专用模型,为 Agent 时代而来。
5/30/2025 4:06:03 PM
清源
华为发布昇腾大模型:无GPU训练高数大题仅需2秒!
最近,华为通过其新推出的 “昇腾 Pangu Ultra MoE” 系统展示了一个令人惊叹的突破:一个近万亿参数的 MoE 大模型在短短2秒内就能理解并解答一道高等数学题。 而这一切都在没有使用 GPU 的情况下实现,显示出华为在自主可控的国产算力和模型训练方面的强大能力。 在技术层面,华为的团队成功提升了训练系统的整体性能,通过智能选择并行策略和优化计算通信,大幅提高了集群的训练效率。
5/30/2025 4:00:54 PM
AI在线
新型人工智能检测可预测前列腺癌患者是否能从药物中获益
近日,国际医学界传来令人振奋的消息,一种新开发的人工智能(AI)工具可以预测哪些前列腺癌患者能够从一种能够将死亡风险降低一半的药物 —— 阿比特龙(abiraterone)中获益。 这种药物被称为前列腺癌治疗的 “游戏规则改变者”,在100多个国家中成为男性最常见的癌症治疗选择,已帮助数十万名晚期前列腺癌患者延长了生命。 然而,一些国家,尤其是英国,对于尚未扩散的前列腺癌患者并未广泛提供这款 “惊人的” 药物。
5/30/2025 4:00:54 PM
AI在线
元宝打通腾讯地图 移动版、网页版已正式上线
近日,元宝与腾讯地图正式实现打通,为用户带来更为精准和便捷的地点搜索及导航服务。 依托腾讯地图的强大功能,元宝在地点搜索方面的表现更加出色,能够满足用户多样化的需求。 现在,当用户询问“附近有修鞋的吗”或是“附近人均百元的粤菜馆有哪些”时,元宝能够结合地图信息,迅速给出准确的推荐。
5/30/2025 4:00:54 PM
AI在线
实测字节扣子空间:AI 播客比真人丝滑,Agent 能打 80% 的工
作者丨王悦编辑丨陈彩娴上个月,字节跳动旗下 Agent「扣子空间」上线之初,曾经一度被挤爆服务器,全网分享内测码。 经过一个月时间的沉淀,AI 科技评论发现了扣子空间最新上线了一个新玩法—— 一键生成播客。 相比于主打任务规划与执行的通用 Agent,AI 播客 Agent 需要的能力确实更丰富,内容理解、多模态融合、语音合成、情感表达、多角色模拟、对话逻辑等能力都不可或缺,这对多模态性能有很大挑战。
5/30/2025 3:44:00 PM
陈淑瑜
OpenAI 坚决反击马斯克:法院裁定请求毫无依据
据路透社报道,OpenAI 近日向法院提出申请,要求继续对特斯拉创始人埃隆・马斯克进行反诉。 OpenAI 在法庭文件中表示,马斯克请求驳回其反诉的动议 “毫无事实依据”。 这一案件的持续发酵,再次引发了公众的关注。
5/30/2025 3:00:54 PM
AI在线
Figure完成史上最大重组:三大技术团队合并成AI核心小组Helix
人形机器人公司Figure今日宣布完成公司历史上规模最大的组织重组,CEO Brett Adcock通过推特透露,上周已将三个独立技术团队合并进新成立的AI小组Helix,旨在打破部门壁垒,加速人形机器人的商业化进程。 以AI模型命名的战略整合新成立的Helix小组以Figure三个月前推出的首个VLA(视觉-语言-行动)具身模型Felix的核心技术命名,凸显了AI在公司战略中的核心地位。 据Figure此前发布的资料显示,Helix技术在多个关键领域取得了突破性进展,专门为Figure人形机器人提供通用智能控制能力,是实现机器人自主操作的关键技术基础。
5/30/2025 3:00:54 PM
AI在线
苹果联合推出 AI 交错推理方法,Qwen2.5 模型响应速度快 80%、准确率提高 19.3%
苹果公司携手杜克大学,提出交错推理(Interleaved Reasoning)的全新强化学习(Reinforcement learning,RL)方法,进一步提升大语言模型的推理能力。
5/30/2025 2:45:12 PM
故渊
Yandex 发布最大音乐推荐开源数据集 Yambda
俄罗斯搜索巨头Yandex发布全球最大音乐推荐开源数据集Yambda,含47.9亿条匿名用户交互数据,覆盖939万首歌曲,助力开发者打造智能音乐服务。数据集分三种规模,最大需85GB存储空间。#音乐科技# #AI推荐#
5/30/2025 2:40:08 PM
准泽(实习)
Anthropic 开源“思维追踪”工具,可视化揭秘 AI 内部逻辑
Anthropic 昨日(5 月 29 日)发布博文,宣布推出“电路追踪”(Circuit Tracer)开源工具,以图形化方式,追踪并展示 AI 大语言模型的内部思维过程。
5/30/2025 2:36:15 PM
故渊
谷歌联合创始人谢尔盖・布林:AI 颠覆搜索,从导航工具升级为洞见提供者
在最新访谈节目中,谷歌联合创始人谢尔盖・布林(Sergey Brin)分享了对未来人工智能(AI)的观点,他认为 AI 彻底改变在线搜索,从根本上改变“搜索”的定义。
5/30/2025 2:23:52 PM
故渊
AI“电老虎”:2025 年底预估占全球数据中心近 50% 用电量,首超加密货币挖矿
科技媒体 The Verge 今天(5 月 30 日)发布博文,报道称最新研究预测,到 2025 年年底,人工智能(AI)的能源消耗将首次超过比特币挖矿,所消耗电力占全球数据中心近一半。
5/30/2025 2:10:05 PM
故渊
手机照片一键变艺术!Runway Gen-4 References解锁相机胶卷新玩法
近日,Runway公司宣布其最新功能Gen-4References已支持移动设备,用户可通过手机相机胶卷中的照片,快速将其转化为风格一致的艺术作品。 这一功能将AI生成技术与移动端便捷性完美结合,为内容创作者和普通用户打开了全新的创作可能性。 AIbase编辑团队根据最新信息整理,为您详细解读这一令人兴奋的技术突破!Gen-4References:手机上的艺术创作革命Runway的Gen-4References功能允许用户通过上传相机胶卷中的照片,结合自然语言提示,生成风格一致的图像或视频内容。
5/30/2025 2:00:54 PM
AI在线
阿里云通义灵码 AI IDE 正式上线,带来编程新体验
阿里云宣布其全新产品 —— 通义灵码 AI IDE 正式上线,用户可以在官网免费下载并立即使用。 通义灵码 AI IDE 是一款原生的人工智能开发环境,深度适配了业界领先的开源模型千问3,支持多种先进功能,为开发者提供了更高效的编程体验。 通义灵码 AI IDE 的最大亮点在于其强大的编程智能体模式。
5/30/2025 2:00:54 PM
AI在线
Hugging Face 推出 HopeJR 和 Reachy Mini 两款开源人形机器人
科技媒体 TechCrunch 昨日(5 月 29 日)发布博文,报道称 AI 开发平台 Hugging Face 最新推出 HopeJR 和 Reachy Mini 两款开源人形机器人,进一步进军机器人领域。
5/30/2025 1:37:43 PM
故渊
Memvid:革新AI记忆的轻量级工具,文本编码视频实现快速语义搜索
一款名为Memvid的创新AI记忆工具近日引发关注。 据官方推文介绍,Memvid通过将文本数据编码为视频格式,实现了亚秒级的快速语义搜索,为AI记忆管理带来革命性突破。 Memvid的独特之处在于其存储方式:将文本信息压缩为MP4视频文件,不仅大幅节省存储空间,还能实现快速检索,且无需联网即可使用。
5/30/2025 12:00:54 PM
AI在线
Salesforce 以 80 亿美元收购 Informatica,助力 AI 发展
Salesforce,这家云软件巨头,最近宣布了一项重磅收购交易,计划以80亿美元的价格收购数据管理公司 Informatica。 这笔交易的价格较 Informatica 一年前的市场价值下降了27%,显示出两家公司在增长放缓的背景下重新谈判的必要性。 自从 Salesforce 去年推出其人工智能产品 Agentforce 以来,AI 行业的竞争愈发激烈,时间的紧迫感让这项收购显得尤为重要。
5/30/2025 12:00:54 PM
AI在线
Anthropic再放大招!Claude新功能解锁AI应用开发,AI Studio迎来新机遇
Anthropic近日宣布了一项令人振奋的更新:其旗舰模型Claude新增功能,支持开发者构建与Claude直接对话的AI应用程序。 这一突破性进展被认为与AI Studio的应用程序开发理念高度契合,为开发者提供了更广阔的创新空间。 AIbase编辑团队根据最新信息整理,为您深入解读这一技术动态及其潜在影响。
5/30/2025 12:00:54 PM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测