资讯列表
中国信通院发布 MaaS 六大标准,解决 AI 模型落地“最后一公里”难题
中国信通院 CAICT 官方公众号昨日(2025 年 1 月 6 日)发布博文,宣布为解决 MaaS 平台服务质量参差不齐、选型困难等问题,推出了 MaaS(Model as a service,模型即服务)系列标准。
加速70倍!支持4K分辨率!ETH全新开源PanSplat:全景GS重建和新视角合成SOTA!
论文信息标题:PanSplat: 4K Panorama Synthesis with Feed-Forward Gaussian Splatting作者:Cheng Zhang, Haofei Xu, Qianyi Wu, Camilo Cruz Gambardella, Dinh Phung, Jianfei Cai机构:Monash University、Building 4.0 CRC, Caulfield East, Victoria, Australia、ETH Zurich原文链接::. 导读随着便携式360°摄像机的出现,全景在虚拟现实(VR)、虚拟旅游、机器人和自动驾驶等应用中获得了极大的关注。 因此,宽基线全景视图合成已经成为一项至关重要的任务,其中高分辨率、快速推理和存储效率是必不可少的。
厦门大学联合网易提出StoryWeaver,可根据统一模型内给定的角色实现高质量的故事可视化
本文经AIGC Studio公众号授权转载,转载请联系出处。 厦门大学联合网易提出StoryWeaver,可以根据统一模型内给定的角色实现高质量的故事可视化。 可根据故事文本生成与之匹配的图像,并且确保每个角色在不同的场景中保持一致。
实时高保真人脸编辑方法PersonaMagic,可根据肖像无缝生成新角色、风格或场景图像。
本文经AIGC Studio公众号授权转载,转载请联系出处。 今天给大家介绍的是一个高保真实时人脸编辑方法PersonaMagic,通过分阶段的文本条件调节和动态嵌入学习来优化人脸定制。 该技术利用时序动态的交叉注意力机制,能够在不同阶段有效捕捉人脸特征,从而在生成个性化图像时最大程度地保留身份信息。
解放人工标注!理想多模态框架UniPLV:开放3D场景理解新SOTA
写在前面 & 笔者的个人理解开放世界的3D场景理解旨在从点云等3D数据中识别和区分开放世界的对象和类别,而无需人工标注。 这对于真实世界的应用,如自动驾驶和虚拟现实等至关重要。 传统的依赖人工标注的闭集识别方法无法满足开放世界识别的挑战,尤其3D语义标注,非常耗费人力和物力。
AI智能体爆发,8亿岗位即将消失!2030年可抢走70%办公室白领饭碗
2024年,AI在技术开发和应用方面真正迎来了迅猛发展期,AI大佬纷纷预测奇点将至。 2025年,AI智能体将兴起,将重塑就业市场! 多家AI企业高管表示2025年AI智能体将能胜任多种工作。
谷歌DeepMind重磅推出多视角视频扩散模型CAT4D,单视角视频也能转换多视角了
单目视觉4D重建再突破! 谷歌DeepMind等团队,推出了多视角视频扩散模型CAT4D,它支持输入单个视角的视频,转换后可以自行拖动。 该模型可以分别固定视角和时间,然后分别输出了视角不动(机位固定)时间变、时间不变视角动,以及视角时间均变动的效果。
Meta最新研究:利用GenAI洞悉用户意图
Meta——Facebook、Instagram、WhatsApp、Threads等公司的母公司——运营着世界上最大的推荐系统之一。 在最近发布的两篇论文中,Meta的研究人员揭示了如何利用生成模型来更好地理解和响应用户意图。 通过将推荐视为一个生成问题,可以采用新的方法来解决它,这些方法在内容上更丰富,效率也高于传统方法。
AAAI 2025 | IML领域稀疏化视觉Transformer,代码已开源
SparseViT 的主要科研成员来自四川大学吕建成团队,合作方为澳门大学潘治文教授团队。 论文:《Can We Get Rid of Handcrafted Feature Extractors? SparseViT: Nonsemantics-Centered, Parameter-Efficient Image Manipulation Localization through Spare-Coding Transformer》论文链接::,图像处理变得非常方便。
(更新:李开复回应)消息称阿里洽谈收购零一万物的预训练团队,人员约为 60 人
据第一财经「新皮层」报道,阿里云正在洽谈收购零一万物的预训练团队,已谈好报价。截至发稿,阿里云未对该消息作出回应。
跨年舞台歌手翻车惨烈,AI唱作俱佳,意外圈粉
AI好好用报道编辑:Sia刚刚过去的跨年舞台,依旧延续了群魔乱舞的台风。 假唱早已见怪不怪。 假唱。
中国 — 金砖国家人工智能发展与合作中心运营基地正式启用
2025 年 1 月 3 日,中国 — 金砖国家人工智能发展与合作中心(简称“金砖中心”)运营基地启用仪式在上海西岸大剧院举行。
人工智能走向核能,互相依赖的时代发展新搭档
编辑丨toileter随着 AI 的能源需求愈发贪婪,风能、太阳能等时兴热门清洁能源已经无法满足 AI 扩张的胃口。 于此时此刻,核电的炒作宛如密西西比河的河水波澜层起。 近些年来,虽然核电的支持者一直在宣扬「核电复兴」,但由于其高昂的成本与较高的维护成本,核能复兴还未获得站上风口的机会。
GPT做不好图生成?Tokenization是关键!新方法重新定义图生成和表示方式
编辑 | ScienceAI图(Graphs)是描述复杂关系和结构化数据的重要工具,从分子设计到社交网络分析,它们在许多领域都扮演着关键角色。 然而,图生成的高效性与灵活性一直是一个挑战。 今天,我们向大家介绍一项突破性的研究——Graph Generative Pre-trained Transformer,简称 G2PT,一个重新定义图生成和表示方式的自回归模型。
未经授权使用相关内容进行模型训练,爱奇艺起诉 MiniMax 索赔 10 万元
据凤凰网科技报道,爱奇艺日前已向上海市徐汇区人民法院正式提起诉讼,指控国内 AI 初创企业 MiniMax 在 AI 模型训练及内容生成流程中涉嫌侵犯其版权。
斯坦福大学研究:AI 在与人类对话仅 2 小时后即可“再现”其个性特征
为了验证AI复制品的准确性,每位参与者都完成了两轮人格测试、社交调查和逻辑游戏,并在两周后再次进行相同的测试。当AI“复制品”进行了这些测试时,它们的回答与真实参与者相符的准确率高达85%。
OpenAI 阿尔特曼:使用次数远超预期,Pro 高级订阅正处于亏损状态
山姆・阿尔特曼表示,ChatGPT Pro 的订阅价格是他个人选择的,本以为会在这种定价下实现一定盈利。
阿尔特曼称 OpenAI 目标开始转向“超级智能”:有望大幅提升财富和繁荣
OpenAI首席执行官萨姆·阿尔特曼表示,他相信OpenAI“知道如何构建人工通用智能”(AGI),即按照传统定义的AGI,并且已经开始将目标转向“超级智能”。