理论

AI伪造论文渗透学术圈：Google Scholar成虚假科学温床，如何应对？

编辑 | 1984随着生成式 AI 技术的普及，学术界正面临着一个新的挑战：越来越多疑似由 AI 生成的研究论文正在渗透到学术期刊、档案库和知识库中。这些论文通常借助 ChatGPT 等普及型 AI 应用来模仿学术写作风格，其危害不容忽视。作为广受欢迎的学术搜索引擎，Google Scholar 在展示搜索结果时，并未区分这些可疑论文与经过严格质量把关的研究成果。

1/22/2025 6:27:00 PM

ScienceAI

一款可快速定位照片的AI工具

由波士顿Graylark Technologies开发的GeoSpy是一款强大的AI工具，可通过分析图像中的建筑风格、植被类型以及建筑物之间的空间关系等特征，在几秒钟内高精度定位照片的拍摄位置。这项技术引起了公众和执法机构的广泛关注，其市场定位为执法部门、威胁情报公司和政府机构提供服务。 GeoSpy经过数百万张全球图片训练，能够识别“显著的地理标志”，如特定的建筑样式、土壤特征及其空间排列关系。

1/22/2025 4:13:07 PM

佚名

API存在安全风险：如何在不断发展的数字环境中保护数据

云计算和人工智能技术彻底改变了企业的运营方式。这两种技术都提供了更高的灵活性和可扩展性。基于云的基础设施使组织能够更快地进行创新。

1/22/2025 3:55:23 PM

AI情报室

UC伯克利等提出具身智能「动作Tokenizer」，效率飙升5倍！

来自π，伯克利和斯坦福的研究者近期提出了FAST，一种为VLA模型设计的高效动作Tokenizer。 FAST旨在解决传统动作Tokenization方法在处理精细任务时面临的挑战，为VLA模型在更复杂、高频的机器人控制任务带来了显著改进。将FAST与π0 VLA结合，在1万小时的机器人数据上对π0-FAST进行训练，效果与最先进的扩散VLA相当，训练时间最多缩短5倍。

1/22/2025 3:21:00 PM

新智元

截胡OpenAI！清华复旦等抢先开源智能体框架Eko，一句话打造「虚拟员工」

OpenAI的首席执行官Sam Altman最近宣布，2025年将推出「虚拟员工计划」，代号Operator，AI智能体能够自主执行任务，如写代码、预订旅行等，成为企业中的「数字同事」。抢在OpenAI发布Operator之前，清华、复旦和斯坦福的研究者联合提出了名为Eko的 Agent开发框架，开发者可以通过简洁的代码和自然语言，快速构建可用于生产的「虚拟员工」。 AI智能体能够接管用户的电脑和浏览器，代替人类完成各种任务，为工作流程提供自动化支持。

1/22/2025 3:17:43 PM

新智元

41%博士后逃生学术界，顶刊PNAS揭残酷真相！名校光环背后曝职业危机

去年，随着LLM产品化和工程化的发展，工业界的研究岗迅速缩减，许多AI博士面临巨大的就业压力，纷纷表示后悔读博。工业界机会稀少，学术界同样问题重重。为此，有的博士生甚至转行去当了主播。

1/22/2025 3:14:57 PM

新智元

36000亿元！OpenAI启动全球史上最大规模AI基础设施项目，英伟达软银甲骨文均参与

史上最大规模AI基础设施项目启动！不久之前，OpenAI官宣了一项“星际之门”（The Stargate Project）计划——将与软银甲骨文组建合资公司，未来4年内总投资5000亿美元（约合3.64万亿元人民币）在美国建立多个AI数据中心。该计划将立即启动，而且OpenAI一出手就准备先投它个1000亿美元。

1/22/2025 2:14:01 PM

深扒星际之门主角团：中东皇室也参与了！奥特曼搭上特朗普，至少5000亿开搞“星际之门”！大规模AI基建时代：带动数十万美国人就业

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）太炸裂了！一早上刷到OpenAI奥特曼和特朗普同框了！特朗普大手一挥，宣布了一个疯狂燃烧经费的AI项目——星际之门计划，将投资 "至少 "5000亿美元！

1/22/2025 1:41:11 PM

伊风

新的 AI 安全在 2025 年正对 CISO 及其团队构成挑战

安全团队总是必须适应变化，但2025年将出现的新发展可能会使变化特别具有挑战性。 AI 创新步伐的加快、日益复杂的网络威胁和新的监管政策将要求首席信息安全官（CISO）驾驭更复杂的环境。供应商正在迅速将AI 功能添加到现有产品中，其使用的基础大型语言模型（LLM）在增强产品能力的同时也暴露了新的攻击面给攻击者，企业CISO 需要了解他们面临这些威胁的严重程度，以及如何缓解这些威胁。

1/22/2025 11:18:41 AM

Zicheng

模型压缩70%！精度更高！开源MoDec-GS：更紧凑、更精确的动态3DGS

本文经3D视觉之心公众号授权转载，转载请联系出处。论文信息标题：MoDec-GS: Global-to-Local Motion Decomposition and Temporal Interval Adjustment for Compact Dynamic 3D Gaussian Splatting作者：Sangwoon Kwak, Joonsoo Kim, Jun Young Jeong, Won-Sik Cheong, Jihyong Oh, Munchurl Kim机构：ETRI, South Korea、KAIST, South Korea、Chung-Ang University, South Korea原文链接：：. 导读3D Gaussian Splatting (3DGS)在场景表示和神经渲染方面取得了重大进展，并致力于使其适应动态场景。

1/22/2025 11:00:00 AM

3DCV

仅用25%数据实现性能超越！MapGS：解决特定传感器配置的在线建图模型训练问题

本文经3D视觉之心公众号授权转载，转载请联系出处。避免传感器配置差异近年来，多模态传感器融合的新进展推动了自动驾驶应用中感知方法的发展。这些进展涵盖了 3D 目标检测、在线地图生成与推理、占用预测，以及端到端框架的形式。

1/22/2025 10:40:00 AM

3D视觉之心

几个开发大模型应用常用的 Python 库

一、应用层开发1. FastAPIFastAPI是构建API的优选。顾名思义，它快速、简单，并能与Pydantic完美集成，实现无缝数据验证。

1/22/2025 10:33:44 AM

zone7

你要跳舞么？复旦&微软提出StableAnimator：可实现高质量和高保真的ID一致性人类视频生成

本文经AIGC Studio公众号授权转载，转载请联系出处。由复旦、微软、虎牙、CMU的研究团队提出的StableAnimator框架，实现了高质量和高保真的ID一致性人类视频生成。 StableAnimator 生成的姿势驱动的人体图像动画展示了其合成高保真和 ID 保留视频的能力。

1/22/2025 10:30:00 AM

AIGC Studio

图像超分辨新SOTA！南洋理工提出InvSR,利用大模型图像先验提高SR性能, 登上Huggingface热门项目

南洋理工大学的研究者们提出了一种基于扩散反演的新型图像超分辨率 (SR) 技术，可以利用大型预训练扩散模型中蕴含的丰富图像先验来提高 SR 性能。该方法的核心是一个深度噪声预测器，用于估计前向扩散过程的最佳噪声图。一旦训练完成，这个噪声预测器就可以用来初始化沿扩散轨迹的部分采样过程，从而生成理想的高分辨率结果。

1/22/2025 10:15:00 AM

AIGC Studio

解决文生图质量和美学问题，字节跳动提出VMix：多维度美学控制方法，一键提升图像美学

本文经AIGC Studio公众号授权转载，转载请联系出处。为了解决扩散模型在文生图的质量和美学问题，字节跳动&中科大研究团队提出VMix美学条件注入方法，通过将抽象的图像美感拆分成不同维度的美学向量引入扩散模型，从而实现细粒度美学图像生成。论文基于提出的方法训练了一个即插即用的模块，无需再训练即可应用于不同的开源模型，提升模型的生成美感。

1/22/2025 9:48:07 AM

AIGC Studio