资讯列表

中国信通院发布 MaaS 六大标准，解决 AI 模型落地“最后一公里”难题

中国信通院发布 MaaS 六大标准，解决 AI 模型落地“最后一公里”难题

中国信通院 CAICT 官方公众号昨日（2025 年 1 月 6 日）发布博文，宣布为解决 MaaS 平台服务质量参差不齐、选型困难等问题，推出了 MaaS（Model as a service，模型即服务）系列标准。

加速70倍！支持4K分辨率！ETH全新开源PanSplat：全景GS重建和新视角合成SOTA！

加速70倍！支持4K分辨率！ETH全新开源PanSplat：全景GS重建和新视角合成SOTA！

论文信息标题：PanSplat: 4K Panorama Synthesis with Feed-Forward Gaussian Splatting作者：Cheng Zhang, Haofei Xu, Qianyi Wu, Camilo Cruz Gambardella, Dinh Phung, Jianfei Cai机构：Monash University、Building 4.0 CRC, Caulfield East, Victoria, Australia、ETH Zurich原文链接：：. 导读随着便携式360°摄像机的出现，全景在虚拟现实(VR)、虚拟旅游、机器人和自动驾驶等应用中获得了极大的关注。因此，宽基线全景视图合成已经成为一项至关重要的任务，其中高分辨率、快速推理和存储效率是必不可少的。

厦门大学联合网易提出StoryWeaver，可根据统一模型内给定的角色实现高质量的故事可视化

厦门大学联合网易提出StoryWeaver，可根据统一模型内给定的角色实现高质量的故事可视化

本文经AIGC Studio公众号授权转载，转载请联系出处。厦门大学联合网易提出StoryWeaver，可以根据统一模型内给定的角色实现高质量的故事可视化。可根据故事文本生成与之匹配的图像，并且确保每个角色在不同的场景中保持一致。

实时高保真人脸编辑方法PersonaMagic，可根据肖像无缝生成新角色、风格或场景图像。

实时高保真人脸编辑方法PersonaMagic，可根据肖像无缝生成新角色、风格或场景图像。

本文经AIGC Studio公众号授权转载，转载请联系出处。今天给大家介绍的是一个高保真实时人脸编辑方法PersonaMagic，通过分阶段的文本条件调节和动态嵌入学习来优化人脸定制。该技术利用时序动态的交叉注意力机制，能够在不同阶段有效捕捉人脸特征，从而在生成个性化图像时最大程度地保留身份信息。

解放人工标注！理想多模态框架UniPLV：开放3D场景理解新SOTA

解放人工标注！理想多模态框架UniPLV：开放3D场景理解新SOTA

写在前面 & 笔者的个人理解开放世界的3D场景理解旨在从点云等3D数据中识别和区分开放世界的对象和类别，而无需人工标注。这对于真实世界的应用，如自动驾驶和虚拟现实等至关重要。传统的依赖人工标注的闭集识别方法无法满足开放世界识别的挑战，尤其3D语义标注，非常耗费人力和物力。

AI智能体爆发，8亿岗位即将消失！2030年可抢走70%办公室白领饭碗

AI智能体爆发，8亿岗位即将消失！2030年可抢走70%办公室白领饭碗

2024年，AI在技术开发和应用方面真正迎来了迅猛发展期，AI大佬纷纷预测奇点将至。 2025年，AI智能体将兴起，将重塑就业市场！多家AI企业高管表示2025年AI智能体将能胜任多种工作。

谷歌DeepMind重磅推出多视角视频扩散模型CAT4D，单视角视频也能转换多视角了

谷歌DeepMind重磅推出多视角视频扩散模型CAT4D，单视角视频也能转换多视角了

单目视觉4D重建再突破！谷歌DeepMind等团队，推出了多视角视频扩散模型CAT4D，它支持输入单个视角的视频，转换后可以自行拖动。该模型可以分别固定视角和时间，然后分别输出了视角不动（机位固定）时间变、时间不变视角动，以及视角时间均变动的效果。

Meta最新研究：利用GenAI洞悉用户意图

Meta最新研究：利用GenAI洞悉用户意图

Meta——Facebook、Instagram、WhatsApp、Threads等公司的母公司——运营着世界上最大的推荐系统之一。在最近发布的两篇论文中，Meta的研究人员揭示了如何利用生成模型来更好地理解和响应用户意图。通过将推荐视为一个生成问题，可以采用新的方法来解决它，这些方法在内容上更丰富，效率也高于传统方法。

AAAI 2025 | IML领域稀疏化视觉Transformer，代码已开源

AAAI 2025 | IML领域稀疏化视觉Transformer，代码已开源

SparseViT 的主要科研成员来自四川大学吕建成团队，合作方为澳门大学潘治文教授团队。论文：《Can We Get Rid of Handcrafted Feature Extractors? SparseViT: Nonsemantics-Centered, Parameter-Efficient Image Manipulation Localization through Spare-Coding Transformer》论文链接：：，图像处理变得非常方便。

（更新：李开复回应）消息称阿里洽谈收购零一万物的预训练团队，人员约为 60 人

（更新：李开复回应）消息称阿里洽谈收购零一万物的预训练团队，人员约为 60 人

据第一财经「新皮层」报道，阿里云正在洽谈收购零一万物的预训练团队，已谈好报价。截至发稿，阿里云未对该消息作出回应。

跨年舞台歌手翻车惨烈，AI唱作俱佳，意外圈粉

跨年舞台歌手翻车惨烈，AI唱作俱佳，意外圈粉

AI好好用报道编辑：Sia刚刚过去的跨年舞台，依旧延续了群魔乱舞的台风。假唱早已见怪不怪。假唱。

中国 — 金砖国家人工智能发展与合作中心运营基地正式启用

中国 — 金砖国家人工智能发展与合作中心运营基地正式启用

2025 年 1 月 3 日，中国 — 金砖国家人工智能发展与合作中心（简称“金砖中心”）运营基地启用仪式在上海西岸大剧院举行。

人工智能走向核能，互相依赖的时代发展新搭档

人工智能走向核能，互相依赖的时代发展新搭档

编辑丨toileter随着 AI 的能源需求愈发贪婪，风能、太阳能等时兴热门清洁能源已经无法满足 AI 扩张的胃口。于此时此刻，核电的炒作宛如密西西比河的河水波澜层起。近些年来，虽然核电的支持者一直在宣扬「核电复兴」，但由于其高昂的成本与较高的维护成本，核能复兴还未获得站上风口的机会。

GPT做不好图生成？Tokenization是关键！新方法重新定义图生成和表示方式

GPT做不好图生成？Tokenization是关键！新方法重新定义图生成和表示方式

编辑 | ScienceAI图（Graphs）是描述复杂关系和结构化数据的重要工具，从分子设计到社交网络分析，它们在许多领域都扮演着关键角色。然而，图生成的高效性与灵活性一直是一个挑战。今天，我们向大家介绍一项突破性的研究——Graph Generative Pre-trained Transformer，简称 G2PT，一个重新定义图生成和表示方式的自回归模型。

未经授权使用相关内容进行模型训练，爱奇艺起诉 MiniMax 索赔 10 万元

未经授权使用相关内容进行模型训练，爱奇艺起诉 MiniMax 索赔 10 万元

据凤凰网科技报道，爱奇艺日前已向上海市徐汇区人民法院正式提起诉讼，指控国内 AI 初创企业 MiniMax 在 AI 模型训练及内容生成流程中涉嫌侵犯其版权。

斯坦福大学研究：AI 在与人类对话仅 2 小时后即可“再现”其个性特征

斯坦福大学研究：AI 在与人类对话仅 2 小时后即可“再现”其个性特征

为了验证AI复制品的准确性，每位参与者都完成了两轮人格测试、社交调查和逻辑游戏，并在两周后再次进行相同的测试。当AI“复制品”进行了这些测试时，它们的回答与真实参与者相符的准确率高达85%。

OpenAI 阿尔特曼：使用次数远超预期，Pro 高级订阅正处于亏损状态

OpenAI 阿尔特曼：使用次数远超预期，Pro 高级订阅正处于亏损状态

山姆・阿尔特曼表示，ChatGPT Pro 的订阅价格是他个人选择的，本以为会在这种定价下实现一定盈利。

阿尔特曼称 OpenAI 目标开始转向“超级智能”：有望大幅提升财富和繁荣

阿尔特曼称 OpenAI 目标开始转向“超级智能”：有望大幅提升财富和繁荣

OpenAI首席执行官萨姆·阿尔特曼表示，他相信OpenAI“知道如何构建人工通用智能”（AGI），即按照传统定义的AGI，并且已经开始将目标转向“超级智能”。

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动 SK 海力士宣布参展 CES 2025，将展示 122TB 企业级固态硬盘等产品阿里云与黑芝麻智能完成大模型车载芯片级适配突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架清华大学推 AutoDroid-V2：AI 离线在线协同，优化移动端自动化 GUI 控制啥玩意值8499元？马斯克在线打call，国产AI威震天秒售罄斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手 AI模拟细胞，走向全新虚拟生命，斯坦福团队呼吁是时候走出全新的一步了

标签云