字节跳动EX-4D震撼开源:单目视频秒变自由视角4D大片
字节跳动旗下PICO-MR团队正式开源了**EX-4D**,一款突破性的4D视频生成框架。 这款工具能够从单一视角(单目)视频生成高质量、多视角的4D视频序列(3D空间 时间维度),标志着视频生成技术迈向了新的里程碑。 EX-4D不仅在技术指标上超越现有开源方法,还为沉浸式3D内容创作和“世界模型”构建提供了关键支持。
7/3/2025 10:01:03 AM
AI在线
荣耀 Magic V5 发布会:李健强调开放生态,携手巨头共筑 AI 未来
在今日荣耀 Magic V5暨 AI 终端生态发布会后的媒体对话中,荣耀 CEO 李健、CFO 彭求恩以及产品线总裁 方飞与媒体进行了深入交流。 发布会上,荣耀正式宣布支持 MCP 和 A2A 协议,并透露将与 阿里巴巴、比亚迪、美的 等合作伙伴在智能体服务生态、智慧车联和智慧家居领域展开深度合作。 荣耀 CEO 李健在对话中强调了“开放”是荣耀的核心理念。
7/3/2025 10:01:03 AM
AI在线
Stability AI开源Stable Audio Open Small,手机秒变音频创作神器
Stability AI联合芯片巨头Arm正式开源Stable Audio Open Small,一款专为移动设备优化的341M参数文本到音频生成模型。 这款轻量化模型能在Arm CPU上本地运行,生成高质量立体声音频,标志着AI音频生成技术向边缘计算和移动设备的重大迈进。 技术亮点:轻量高效,移动端本地生成Stable Audio Open Small基于Stability AI此前发布的Stable Audio Open模型,通过深度优化,参数量从1.1B压缩至341M,显著降低了计算需求。
7/3/2025 10:00:57 AM
AI在线
科学家们有话说!SciArena 平台上线,多维度评测大语言模型科学表现
一个名为 SciArena 的全新开放平台现已上线,旨在通过人类偏好评估大型语言模型(LLM)在科学文献任务中的表现。 早期结果已揭示不同模型之间存在显著的性能差距。 SciArena 由耶鲁大学、纽约大学和艾伦人工智能研究所的研究人员共同开发,旨在系统性评估专有和开源 LLM 处理科学文献任务的效果,填补了该领域系统性评估的空白。
7/3/2025 10:00:57 AM
AI在线
亚马逊发布新 AI 模型Deep Fleet ,机器人数量突破百万大关
在近期的一项重要宣布中,全球电商和云计算巨头亚马逊揭示了其在机器人技术和人工智能(AI)领域取得的两个重要里程碑:推出全新的 AI 基础大模型 Deep Fleet,并且成功部署的机器人数量突破了100万。 Deep Fleet 模型的推出,旨在提升亚马逊全球最大的工业移动机器人车队的智能化和效率。 该模型的应用预计能够将机器人车队的出行效率提升10%,从而加速包裹配送的速度,同时降低运营成本,为客户提供更好的服务体验。
7/3/2025 10:00:57 AM
AI在线
Cursor 大胆挖人!Claude Code 核心人物转投竞争对手
在 AI 行业的竞争愈发激烈之际,最近发生了一起令人瞩目的 “挖人” 事件。 知名编程应用 Cursor 的开发商 Anysphere,成功挖走了 Anthropic 的两位核心人物:Claude Code 项目的开发负责人 Boris Cherny 和产品经理 Cat Wu。 这一动作不仅让业内人士大感意外,也让 Anthropic 与 Cursor 之间的合作关系变得复杂。
7/3/2025 10:00:57 AM
AI在线
动画字幕翻车!Crunchyroll 新剧竟然用 AI 生成,内容让人哭笑不得
最近,Crunchyroll 推出的新动画《涅库罗若美子的宇宙恐怖秀》引发了不小的争议。 网友在 Reddit 上曝光,该动画的字幕中出现了大量错误,似乎是由人工智能(AI)生成的,导致观众对剧情产生了困惑。 更令人哭笑不得的是,字幕中竟然出现了 “ChatGPT 说” 等字样,显然是未经过严谨审核的结果。
7/3/2025 10:00:57 AM
AI在线
OpenAI与甲骨文强强联手,打造星际之门数据中心计划
在人工智能领域,OpenAI 与甲骨文公司近日宣布了一项重磅合作,双方将加码 “星际之门” 计划,致力于在美国建立更多数据中心。 这一合作旨在满足日益增长的计算能力需求,助力 AI 技术的快速发展。 据知情人士透露,OpenAI 将从甲骨文的数据中心租用大量计算能力,预计将使用约4.5吉瓦的电力。
7/3/2025 10:00:57 AM
AI在线
DeepSWE 开源 AI Agent系统强势登顶,基于 Qwen3-32B
在人工智能领域,又一重磅消息传来。 今天凌晨,知名大模型训练平台 Together.ai 与 Agentica 联合推出了开源 AI Agent框架 DeepSWE。 这一创新系统是基于阿里最新开源的 Qwen3-32B 模型,完全通过强化学习进行训练。
7/3/2025 10:00:57 AM
AI在线
MIT 研究发现:使用 AI 写作工具或降低大脑活跃度
近日,麻省理工学院媒体实验室发布了一项新的研究,揭示了使用人工智能工具(如 ChatGPT)进行写作任务可能导致大脑活跃度降低。 该研究标题为《你在使用 ChatGPT 时的大脑:使用 AI 助手进行论文写作任务时的认知债务累积》。 图源备注:图片由AI生成,图片授权服务商Midjourney在这项研究中,研究人员分为三组进行实验:一组仅使用自己的大脑,另一组使用搜索引擎,最后一组使用大型语言模型(LLM),例如 ChatGPT。
7/3/2025 10:00:57 AM
AI在线
超CLIP准确率11%!伯克利港大阐明「LLM文本-视觉」对齐深层机制
多模态对齐模型近年来凭借对比学习范式在图像检索、文生图等任务中表现出色。 然而,主流框架(如 CLIP)需要从零训练文本和图像编码器,导致计算成本高昂,尤其在处理长文本或大规模数据时更加明显。 近期,相关工作尝试将预训练的大语言模型(LLM)作为文本编码器融入多模态对齐框架,并在分类和检索任务上观察到性能提升。
7/3/2025 9:49:43 AM
ChatGPT惨败Llama!MIT官宣AI开飞船0%失败率,马斯克火星殖民不再是梦
刚刚,一项最新关于AI「驾驶」宇宙飞船的研究刚发布就火了! 在由Kerbal Space Program衍生的航天挑战赛中,MIT等研究团队让ChatGPT作为「主控」智能体,竟然一举夺得第二名。 这项比赛被视为太空探索自主化的重要实验场,而AI的表现,也预示着「AI开飞船」或许比我们想象的更近!
7/3/2025 9:46:37 AM
周志华团队新作:LLM中存在奖励模型,首次理论证明RL对LLM有效性
将大语言模型(LLMs)与复杂的人类价值观对齐,仍然是 AI 面临的一个核心挑战。 当前主要的方法是基于人类反馈的强化学习(RLHF)。 该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分,最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。
7/3/2025 9:41:27 AM
AI Agent、传统聊天机器人有何区别?如何评测?这篇30页综述讲明白了
论文作者包括来自上海交通大学的朱家琛、芮仁婷、单榕、郑琮珉、西云佳、林江浩、刘卫文、俞勇、张伟楠,以及华为诺亚研究所的朱梦辉、陈渤、唐睿明。 本文第一作者是朱家琛,上海交通大学博士生,主要研究兴趣集中在大模型推理,个性化 Agent。 本文通讯作者是张伟楠,上海交通大学教授,研究方向包含强化学习、数据科学、机器人控制、推荐搜索等。
7/3/2025 9:38:48 AM
ElementPlusX + RuoyiAI:Vue3 首个 AI 开发模板开源了!
在 AI 技术飞速发展的今天,开发一款自己的 AI 应用成为了许多开发者的追求。 然而,从零开始搭建一个完整的 AI 开发环境,往往需要耗费大量的时间和精力。 为了帮助开发者快速进入 AI 开发领域,一个基于 Vue3.5 的全新 AI 开发模板——ruoyi-element-ai 正式开源了!
7/3/2025 9:36:35 AM
小4子
刚刚,神秘模型火了!网友:是OpenAI要开源?
刚刚,OpenRouter 上出现了一个神秘模型,该模型被命名为「Cypher Alpha」。 其可以免费使用,100 万 token 上下文,还具有推理能力。 注:OpenRouter 是一个大模型 API 路由器,旨在将各种 AI 模型和服务集成到一个统一的接口中。
7/3/2025 9:31:52 AM
联发科推出专为中国台湾地区用语及口音设计的开源 AI 语音识别模型
这一名为MR BreezeASR 25的模型以 Apache 2.0 许可开源公布,不会出现将“发生什么事”听成“花生什么事”等类似识别错误。
7/3/2025 9:30:16 AM
溯波(实习)
让GUI智能体不再「过度执行」,上海交大、Meta联合发布OS-Kairos系统
本文第一作者是上海交通大学计算机学院三年级博士生程彭洲,研究方向为多模态大模型推理、AI Agent、Agent 安全等。 通讯作者为张倬胜助理教授和刘功申教授。 一、论文概述1.1 研究背景随着多模态大语言模型(Multimodal Large Language Models, MLLMs)的快速发展,越来越多的研究聚焦于构建能够在图形用户界面(GUI)中执行复杂任务的智能体。
7/3/2025 9:27:57 AM
资讯热榜
AI Hacker Rises to Power! XBOW's Autonomous AI Tool Dominates HackerOne, Revealing Thousands of Vulnerabilities and Intimidating the Cybersecurity Industry
我国首个发电行业大模型“擎源”发布,模型参数达千亿级别
告别复杂SQL!用Spring AI + DeepSeek构建自然语言查询系统
Vibemotion AI Released! One-Click Generation of Dynamic Videos, Zero-Barrier Creation Triggers a Visual Revolution
Hengbot 推出 Sirius 机器狗:集成 OpenAI,可跳舞、踢足球
未来已来!Hengbot发布 Sirius 机器狗,能跳舞会踢球,还有AI陪聊
豆包AI编程重磅升级!零代码小白也能轻松打造专属网页,实时编辑超省心!
豆包AI高考成绩达清北录取线!文科683分领跑国内外顶级模型
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
Meta
GPT
学习
图像
技术
Gemini
AI创作
马斯克
论文
代码
Anthropic
英伟达
算法
Stable Diffusion
芯片
智能体
训练
开发者
生成式
蛋白质
腾讯
苹果
神经网络
3D
研究
生成
Claude
AI新词
机器学习
计算
LLM
Sora
AI设计
AI for Science
AI视频
GPU
人形机器人
xAI
华为
百度
搜索
大语言模型
场景
Agent
字节跳动
预测
深度学习
伟达
大型语言模型
Transformer
工具
视觉
RAG
神器推荐
模态
Copilot
亚马逊
具身智能
文本
LLaMA
算力
驾驶
API