AI在线 - 阅读最新头条AI资讯文章，掌握AI人工智能科技动态

头条

颠覆传统！海螺集团联手华为发布水泥建材业首个AI大模型，赋能产业智能化升级

近日，一场引领水泥建材行业变革的技术发布会吸引了业界的广泛关注。国内领先的水泥制造商海螺集团携手科技巨头华为，共同揭开了行业内首个人工智能大模型的神秘面纱。这不仅仅是一次简单的技术应用，更是对传统生产模式的一次深度革新。

4/24/2025 10:01:17 AM

AI在线

香港与英国研究团队提出创新图像标记化方法分层结构提升重建质量

一组来自香港和英国的研究人员近日提出了一种新型图像标记化方法，旨在以更紧凑、更精确的方式将图像转换为数字表示（即令牌）。与传统方法将信息均匀分布于所有标记中不同，该方法采用分层结构，逐层捕捉视觉信息，从而提升了图像重建的质量和效率。传统的图像标记化技术通常会将图像的每个部分均等地划分为多个标记，而新方法则采取了分层结构。

4/24/2025 10:01:16 AM

AI在线

微软365Copilot新增研究员和分析师机器人，助力企业智能化

近日，微软对其365Copilot 进行了更新，推出了一系列新功能，包括 AI 驱动的企业搜索、推理代理和一个新的代理商店。一些用户已经可以体验到这些新功能，而其他用户可能需要等待到5月份才能使用。其中，AI 驱动的企业搜索备受关注。

4/24/2025 10:01:16 AM

AI在线

AWS 发布 SWE-PolyBench:评估 AI 编程助手的新开源基准

近日，AWS AI Labs 推出了 SWE-PolyBench，这是一个多语言的开源基准，旨在为 AI 编程助手的评估提供一个更全面的框架。随着大规模语言模型（LLM）的进步，AI 编程助手的开发已经取得了显著的进展，这些助手能够生成、修改和理解软件代码。然而，目前的评估方法仍然存在诸多局限，许多基准测试往往仅集中在 Python 等单一语言，无法全面反映真实代码库的结构和语义多样性。

4/24/2025 10:01:16 AM

AI在线

Ostris发布Flex.2-preview，8B参数扩散模型革新ComfyUI工作流

Ostris团队发布Flex.2-preview，一款基于8亿参数的文本到图像扩散模型，专为集成到ComfyUI工作流设计。据AIbase了解，该模型在基于线条、姿态和深度的控制生成能力上表现出色，支持通用控制与图像修补功能，延续了从Flux.1Schnell到OpenFlux.1、Flex.1-alpha的微调进化路径。 Flex.2-preview已在Hugging Face开源，凭借Apache2.0许可证与灵活的工作流集成，迅速成为AI艺术创作社区的焦点。

4/24/2025 10:01:15 AM

AI在线

谷歌 Workspace 再添 AI 功能，音频概述与会议跟踪全新上线

谷歌近日宣布，旗下 Workspace 产品将引入更多 AI 工具，尤其是对其 Gemini 功能的扩展。这些更新包括新的音频概述（）功能和改进的会议跟踪方式，旨在提升用户的工作效率和体验。新推出的音频概述功能，最初在谷歌的 NotebookLM 中亮相，允许用户围绕自己选择的研究主题创建播客。

4/24/2025 10:01:15 AM

AI在线

Meta为Ray-Ban智能眼镜推出实时翻译功能

近日，Meta 公司宣布，为其 Ray-Ban 智能眼镜推出多种新功能，包括实时翻译、Instagram 消息和通话功能等。这些功能原本仅限于 Meta 的抢先体验计划用户，现在已全面向所有 Ray-Ban 智能眼镜用户开放。实时翻译功能最早在2024年 Meta Connect 大会上首次披露，并于去年12月在部分国家进行有限测试。

4/24/2025 10:01:15 AM

AI在线

OpenAI发布gpt-image-1 API，4o图像生成能力正式开放

OpenAI正式推出gpt-image-1API，标志着其备受瞩目的4o图像生成能力向开发者开放。据AIbase了解，这一API以其高保真图像生成、多样化视觉风格与强大的世界知识整合能力，被社区誉为“世界最强生图”工具。发布消息迅速在AI开发者与创意社区中引发热烈反响，相关文档已通过OpenAI官网与Playground平台公开。

4/24/2025 10:01:14 AM

AI在线

SLAM3R：北大陈宝权团队等只用单目长视频就能实时重建高质量的三维稠密点云

北京大学陈宝权团队和香港大学等高校及业界机构联合推出实时三维重建系统 SLAM3R，首次实现从长视频（单目 RGB 序列）中实时且高质量地重建场景的稠密点云。 SLAM3R 使用消费级显卡（如 4090D）即可达到 20 FPS 的性能，重建点云的准确度和完整度达到当前最先进水平，同时兼顾了运行效率和重建质量。该研究成果被 CVPR 2025 接收为 Highlight 论文，并在第四届中国三维视觉大会（China3DV 2025）上被评选为年度最佳论文，合作者为董思言博士（共同一作）、王书哲博士、尹英达博士、杨言超助理教授和樊庆楠博士，第一作者为北京大学本科生刘宇政。

4/24/2025 9:44:05 AM

机器之心

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

上个月，OpenAI 在 ChatGPT 中引入了图像生成功能，广受欢迎：仅在第一周，全球就有超过 1.3 亿用户创建了超过 7 亿张图片。就在刚刚，OpenAI 又宣布了一个好消息：他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1，让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。这也意味着，从今天开始，全世界的开发人员都可以使用 ChatGPT 强大的图像生成功能了。

4/24/2025 9:38:56 AM

机器之心

扩散模型还原被遮挡物体，几张稀疏照片也能"脑补"完整重建交互式3D场景｜CVPR'25

你是否设想过，仅凭几张随手拍摄的照片，就能重建出一个完整、细节丰富且可自由交互的3D场景？在传统方法中，这几乎是不可能完成的任务，稀少的拍摄视角往往导致模型无法还原被遮挡的区域，生成的场景要么残缺不全，要么细节模糊。更令人困扰的是，传统的重建算法无法解耦场景中的独立物体，重建结果无法交互，严重限制了在具身智能、元宇宙和影视游戏等领域的应用前景。

4/24/2025 9:38:00 AM

可媲美GPT-4o的开源图像生成框架来了！腾讯联手InstantX解决角色一致性难题

GPT-4o带火的漫画风角色生成，现在有了开源版啦！腾讯混元携手InstantX团队合作打破次元壁，开源定制化角色生成插件——InstantCharacter。以往针对角色驱动的图像生成方法，都存在一定的缺陷。

4/24/2025 9:35:00 AM

告别“AI失忆症”！新型SD-LoRA算法实现终身学习｜ICLR 2025

彻底摆脱传统方法对旧数据存储的依赖！哈佛团队联手香港城大、西安交大最新发布的SD-LoRA技术，通过固定已学习任务的方向参数，仅调整幅度权重，完全避免了历史数据的存储需求。能够在减少50%以上参数存储的同时保持最高准确率，并且在不增加推理开销的前提下显著缓解了灾难性遗忘问题。

4/24/2025 9:30:00 AM

量子位

挤爆字节服务器的Agent到底啥水平？一手实测来了

“字节版Manus”有多能打？量子位实测在此。 △扣子智能体生成的活动介绍网页我们用光了一天的对话额度，考验了扣子空间（Coze Space）的信息整理、任务执行、工具调用等多项技能。

4/24/2025 9:27:00 AM

量子位

大模型数据味蕾论

AI大模型就像一位厨师，预训练数据就是这位厨师的味蕾。没有经过训练的味蕾，再好的食材也无法变成美味佳肴。没有优质的预训练数据，再强大的计算资源也打造不出卓越大模型。

4/24/2025 9:26:13 AM

大数据AI智能圈

ICLR 2025 Oral | 训练LLM，不只是多喂数据，PDS框架给出最优控制理论选择

本文第一作者顾煜贤（）为清华大学计算机系四年级直博生，师从黄民烈教授，研究方向为语言模型的高效训练与推理方法。他曾在 ACL，EMNLP，ICLR 等会议和期刊上发表近 20 篇论文，多次进行口头报告，Google Scholar 引用数 2600 ，曾获 2025 年苹果学者奖学金。本篇论文为他在微软亚洲研究院实习期间所完成。

4/24/2025 9:25:00 AM

机器之心

特斯拉 Optimus 人形机器人试生产线亮相，马斯克称年底数千台将入驻工厂

4 月 24 日消息，在特斯拉 2025 年第一季度更新报告中，公司首次向外界展示了 Optimus 人形机器人试生产线。特斯拉表示，Optimus 的生产时间表保持不变，公司正朝着尽快生产出能够完成有用工作的首批人形机器人的目标迈进。据IT之家了解，特斯拉的 Optimus 试生产线位于弗里蒙特工厂，这里是特斯拉众多项目的起点。

4/24/2025 9:21:15 AM

远洋

一天拿下3.4k star，这个1.6B开源模型火了，合成对话超逼真

如果不提前告诉你，你可能很难相信这段视频里的语音全部是 AI 生成的：这些声音来自 Dia-1.6B——一个刚刚在 𝕏、GitHub 等平台上走红的开源语音模型。它不仅能生成说话的声音、对话，同时也能合成真实感非常强的笑声、喷嚏声和吸鼻子声等表达情绪的声音。由于效果过于逼真，它在 GitHub 上线后不到 24 小时就收获了超过 3.4k star，现在的 star 数更是已经达到了 5.4k。

4/24/2025 9:21:00 AM

机器之心

资讯热榜

这样在本地搭建DeepSeek可以直接封神：本地部署+避坑指南（升级版）基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统 Manus开源平替！Kortix-AI正式发布开源通用AI智能体平台Suna 纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Trae v1.3.0重磅更新，新增MCP与.rules支持引领AI开发新体验 Figma 推 AI 革命：开发智能应用制作器与网站创建工具扣子空间Coze Space正式开启内测支持 MCP 扩展集成腾讯混元3D AI引擎2.5即将揭晓，3D生成技术再升级

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据机器人模型谷歌大模型 Midjourney 智能用户开源学习 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora 3D Anthropic AI for Science AI设计机器学习 GPU 开发者 AI视频场景华为预测百度人形机器人伟达苹果 Transformer 深度学习模态 xAI 字节跳动 Claude 大语言模型搜索驾驶文本神器推荐具身智能 Copilot LLaMA 算力视频生成安全干货合集视觉应用大型语言模型科技亚马逊特斯拉 AGI 训练 2024

颠覆传统！海螺集团联手华为发布水泥建材业首个AI大模型，赋能产业智能化升级

香港与英国研究团队提出创新图像标记化方法 分层结构提升重建质量

微软365Copilot新增研究员和分析师机器人，助力企业智能化

AWS 发布 SWE-PolyBench:评估 AI 编程助手的新开源基准

Ostris发布Flex.2-preview，8B参数扩散模型革新ComfyUI工作流

谷歌 Workspace 再添 AI 功能，音频概述与会议跟踪全新上线

​Meta为Ray-Ban智能眼镜推出实时翻译功能

OpenAI发布gpt-image-1 API，4o图像生成能力正式开放

SLAM3R：北大陈宝权团队等只用单目长视频就能实时重建高质量的三维稠密点云

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

扩散模型还原被遮挡物体，几张稀疏照片也能"脑补"完整重建交互式3D场景｜CVPR'25

可媲美GPT-4o的开源图像生成框架来了！腾讯联手InstantX解决角色一致性难题

告别“AI失忆症”！新型SD-LoRA算法实现终身学习｜ICLR 2025

挤爆字节服务器的Agent到底啥水平？一手实测来了

大模型数据味蕾论

ICLR 2025 Oral | 训练LLM，不只是多喂数据，PDS框架给出最优控制理论选择

特斯拉 Optimus 人形机器人试生产线亮相，马斯克称年底数千台将入驻工厂

一天拿下3.4k star，这个1.6B开源模型火了，合成对话超逼真

香港与英国研究团队提出创新图像标记化方法分层结构提升重建质量

Meta为Ray-Ban智能眼镜推出实时翻译功能