AI资讯列表 - AI在线

马斯克：OpenAI 把名字改成 ClosedAI 就放弃起诉

感谢埃隆・马斯克近日在 X 表示，如果 OpenAI 同意将名称改为“ClosedAI”，他就撤销针对 OpenAI 的诉讼。此前马斯克对 OpenAI 及其 CEO 萨姆・阿尔特曼提起诉讼，马斯克声称他们违反了双方关于人工智能开发的原始合同协议。OpenAI 迅速对马斯克的指控进行反击，称双方冲突的核心是围绕向营利性结构转变的讨论。OpenAI 称，马斯克曾提出与特斯拉合并或完全控制 OpenAI ，但这些要求与 OpenAI 的使命不相符。IT之家曾报道，OpenAI 昨日发布长文博客《OpenAI and E

微软 AI 图片生成器被自家员工举报：可生成有害图像

感谢据 CNBC 报道，一位微软工程师向美国联邦贸易委员会 (FTC) 举报该公司的人工智能图片生成器 Copilot Designer 存在安全隐患。这位名叫 Shane Jones 的工程师在微软工作了六年，他致信 FTC 称，尽管他反复警告 Copilot Designer 可能会生成有害图像，但微软却“拒绝”下架该工具。在测试 Copilot Designer 的安全问题和缺陷时，Jones 发现该工具会生成“与堕胎权术语相关的恶魔和怪物、手持突击步枪的青少年、暴力场景中性化的女性图像以及未成年人饮酒和吸毒

IEEE可解释AI体系架构标准P2894正式发布

可解释AI（XAI）是人工智能的一个新兴分支，用于解释人工智能所做出的每一个决策背后的逻辑，是人工智能可持续发展核心关注点之一。随着大模型时代的到来，模型变得越来越复杂，关注可解释性对于提升人工智能系统的透明度、安全性和可靠性具有重要意义。可解释AI国际标准IEEE P2894发布，打开AI“黑匣子”近期，IEEE标准协会关于可解释AI体系架构的标准P2894（Guide for an Architectural Framework for Explainable Artificial Intelligence）正

用扩散模型生成神经网络？NUS 尤洋团队：这不是开玩笑

作者：赖文昕编辑：郭思、陈彩娴说起扩散模型生成的东西，你会立刻想到什么？是OpenAI的经典牛油果椅子？是英伟达Magic3D生成的蓝色箭毒蛙？

AI4Science的基石：几何图神经网络，最全综述来了！人大高瓴联合腾讯AI lab、清华、斯坦福等发布

编辑 | XS2023 年 11 月，Nature 连续刊登了两篇重大成果：蛋白质生成方法 Chroma 和晶体材料设计方法 GNoME，均使用了图神经网络作为科学数据的表示工具。实际上，图神经网络，特别是几何图神经网络，一直是科学智能（AI for Science）研究的重要工具。这是因为，科学领域中的粒子、分子、蛋白质、晶体等物理系统均可被建模成一种特殊的数据结构——几何图。与一般的拓扑图不同，为了更好描述物理系统，几何图加入了不可或缺的空间信息，需要满足平移、旋转和翻转的物理对称性。鉴于几何图神经网络对于物理

击败GPT-4的那群人

机器之能报道编辑：吴昕很少有人注意到 Claude 3 兼顾安全的努力以及背后深刻动机。还有他们客户群体的特点。Claude 3绘制的它自己，在社交媒体上广为流传。GPT-4 结束了“独孤求败”的日子。前几天，OpenAI 最大的竞争对手 Anthropic 发布了新一代 AI 大模型系列 —— Claude 3。该系列包含三个“杯型”，按能力由弱到强（价格由低到高）排列分别是 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。其中，能力最强的 Opus 在多项基准测试中

「还是谷歌好」，离职创业一年，我才发现训练大模型有这么多坑

Karpathy：中肯的，一针见血的。如何在不到一年的时间里创办一家公司、筹集资金、购买芯片，并搭建出追赶 Gemini pro/GPT 3.5 的 LLM？很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇，但真正走完「从零开始」这一流程的人很少。我们普遍认为，储备技术人才是前提，掌握核心算法是关键，但实际上，工程实践中冒出来的挑战，也实在令人头疼。一年前，乘着大模型的热潮，Yi Tay 离开了工作 3 年多的谷歌，参与创办了一家名为 Reka 的公司并担任首席科学家，主攻大型语言模型。在谷歌时，Yi T

Pieter Abbeel 新工作“大世界模型”：轻松玩转1小时长视频，一对一QA视频内容细节

作者：赖文昕编辑：陈彩娴自3天前Sora发布以来，由图灵奖得主、Meta首席科学家Yann LeCun提出的“世界模型”又一次引起了广泛关注。 “世界模型”作为Sora的一大核心亮点，被OpenAI写在技术报告中。但Sora是否真的如Open AI所说，是一个世界模型，却引起了行业内的争论。

谷歌被曝翻车内幕：内部群龙无首，生图机制过分“多元化”

感谢IT之家网友 rolan6 的线索投递！谷歌 Gemini 文生图风波还未平，更劲爆的内幕消息又被曝出来了。Pirate Wires 爆料，Gemini 这次的翻车，谷歌内部此前并不是毫不知情，翻车甚至是“故意”导致的。具体来说，谷歌设置了一个“安全”架构，Gemini 要生成一张图实际上要经过三个模型。大概来说，流程是这样的：用户在聊天界面请求 Gemini 生成一张图片，Gemini 收到请求后，会把请求发送给一个较小的模型。这个较小的模型的作用是根据公司的“多元化”政策重写用户的提示。为做到这一点，这个较

想搞AI，高中别学数据科学：奥特曼、马斯克此刻终于一致了

高中阶段学习数据科学能不能代替数学，这个话题的讨论已经延伸到了 AI 圈。为了 AI 的发展，再不加强基础教育就晚了。在大模型技术高速发展，各家公司激烈竞争的同时，有人站出来对于未来的人才表示了担忧，焦点在于数学。近日，加州大学（UC）系统对于入学新生设立数学基础标准的消息掀起了轩然大波。随着全国范围内数学成绩的下降，一些教育工作者认为，标准的代数密集型数学教育需要改革，既可以吸引更多的学生，也可以帮助他们在日益依赖数据的未来培养相关技能。有组织称，目前至少有 17 个州已把「数据科学」作为高中数学教育的可选项，俄

Sora 时代的 AI 视频生成何去何从？

Sora 作为 OpenAI 最新发布的视频生成模型，在全球范围内引起了热烈讨论。距离上一个引发全民讨论的视频生成模型 Pika 1.0 的发布，不到三个月的时间。Sora 生成的视频有着合理的连贯性、视频主体细节足以达到以假乱真的程度。仿佛一夜之间解决了 AI 生成视频的长度、流畅性、逻辑性等问题。Sora 带来的视觉震撼，让「扔进一部小说、出来一部大片」逐步成为现实。技术的突破令人振奋，一度引发了大佬们关于世界模型的讨论，可见 Sora 早已超出了大众对技术上限的想象。与此同时，Sora 带来的恐慌和焦虑也正在

Midjourney封禁Stability AI：恶意爬取数据，致服务器瘫痪24小时

Stability AI CEO Emad 表示他并不知情。Midjourney 把 Stability AI 拉入黑名单了，禁止后者所有员工使用其软件，直至另行通知。这两家 AI 图像生成公司之间发生什么事了。虽然 AI 生图领域，看似百花齐放，但论资排辈，Midjourney、Stability AI 还是很受用户欢迎的。就算是竞争对手，Midjourney 也不至于禁止 Stability AI 员工使用其软件吧。事情是这样的，根据爆料者的信息显示：「Midjourney 服务器上周六凌晨受到与 Stabil

全面超越ViT，美团、浙大等提出视觉任务统一架构VisionLLAMA

半年多来，Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功（训练稳定、容易做 scaling）。沿袭 ViT 的研究思路，我们能否借助创新性的 LLaMA 架构，真正实现语言和图像的架构统一？在这一命题上，最近的一项研究 VisionLLaMA 取得了进展。VisionLLaMA 在图像生成（包含 Sora 依赖的底层的 DIT）和理解（分类、分割、检测、自监督）等多个主流任务上相较于原 ViT 类方法提升显著。论文标题：VisionLLaMA: A Unified LLaMA Interfac

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

模型量化是模型压缩与加速中的一项关键技术，其将模型权重与激活值量化至低 bit，以允许模型占用更少的内存开销并加快推理速度。对于具有海量参数的大语言模型而言，模型量化显得更加重要。例如，GPT-3 模型的 175B 参数当使用 FP16 格式加载时，需消耗 350GB 的内存，需要至少 5 张 80GB 的 A100 GPU。但若是可以将 GPT-3 模型的权重压缩至 3bit，则可以实现单张 A100-80GB 完成所有模型权重的加载。现有的大语言模型后训练量化算法依赖于手工制定量化参数，优于缺乏相应的优化过程，

极空间 NAS 上线“AI 实验室”功能：自然语言搜图、以图搜图、文字识别

极空间 NAS 官方宣布，全新 AI 功能 ——【AI 实验室】已正式上线，功能包括：自然语言搜索、相似图片搜索和图片文字识别。据介绍，【AI 实验室】可以帮助用户快速找出极相册中需要的图片，IT之家附内容如下：自然语言搜索智能搜图，开启后，可以使用自然语言搜索图片。点击智能 AI，开启智能搜图，在搜索框中输入文字“狗”，通过 AI 计算后，稍等片刻，就会把极相册中带“狗”的照片展示出来。相似图片搜索以图搜图，开启后，可以通过一张照片找到相似内容或是风格的其他图片。点击智能 AI，开启以图搜图，在极相册中找到一张你

阿里巴巴推出 AtomoVideo 高保真图生视频框架，兼容多种文生图模型

感谢阿里巴巴研究团队近日推出了 AtomoVideo 高保真图生视频（I2V，Image to Video）框架，旨在从静态图像生成高质量的视频内容，并与各种文生图（T2I）模型兼容。 ▲ 图源 AtomoVIdeo 团队论文IT之家总结 AtomoVideo 特性如下：高保真度：生成的视频与输入图像在细节与风格上保持高度一致性运动一致性：视频动作流畅，确保时间上的一致性，不会出现突兀的跳转视频帧预测：通过迭代预测后续帧的方式，支持长视频序列的生成兼容性：与现有的多种文生图（T2I）模型兼容高语义可控性：能够根据用

毫末Cam4DOcc入选CVPR2024：仅用摄像头做4D占据网络预测，让自动驾驶拥有时空预测能力

2024年2月27日，由毫末智行人工智能技术团队提交的论文《Cam4DOcc: Benchmark for Camera-Only 4D Occupancy Forecasting in Autonomous Driving Applications》成功入选国际顶会 CVPR 2024。毫末提出的Cam4DOcc 是一个仅使用摄像头进行 4D 占据网格预测的新基准，用来评估近期内周围场景的变化，可以将仅使用摄像头的占据网格估计扩展到时空预测，从而提升自动驾驶对周围环境在动态时间上的变化感知预测能力。首先，毫末基于

消息称新加坡主权财富基金淡马锡有意投资 OpenAI

感谢据英媒《金融时报》报道，新加坡主权财富基金淡马锡有意投资 OpenAI。淡马锡由新加坡财政部完全控股。2021 年淡马锡规模高达 3810 亿新加坡元（IT之家备注：当前约 2 万亿元人民币），与另一只新加坡政府所有的基金 GIC 一同进入主权财富基金榜单前十。两位知情人士透露，作为全球最大最活跃的投资者之一的淡马锡，其高管最近几个月多次会见了 OpenAI 首席执行官山姆・阿尔特曼（Sam Altman）。另一位熟悉内情的人士表示，双方谈判始于对阿尔特曼的风投基金 Hydrazine Capital 的投资，