资讯列表

马斯克:OpenAI 把名字改成 ClosedAI 就放弃起诉

感谢埃隆・马斯克近日在 X 表示,如果 OpenAI 同意将名称改为“ClosedAI”,他就撤销针对 OpenAI 的诉讼。此前马斯克对 OpenAI 及其 CEO 萨姆・阿尔特曼提起诉讼,马斯克声称他们违反了双方关于人工智能开发的原始合同协议。OpenAI 迅速对马斯克的指控进行反击,称双方冲突的核心是围绕向营利性结构转变的讨论。OpenAI 称,马斯克曾提出与特斯拉合并或完全控制 OpenAI ,但这些要求与 OpenAI 的使命不相符。IT之家曾报道,OpenAI 昨日发布长文博客《OpenAI and E

微软 AI 图片生成器被自家员工举报:可生成有害图像

感谢据 CNBC 报道,一位微软工程师向美国联邦贸易委员会 (FTC) 举报该公司的人工智能图片生成器 Copilot Designer 存在安全隐患。这位名叫 Shane Jones 的工程师在微软工作了六年,他致信 FTC 称,尽管他反复警告 Copilot Designer 可能会生成有害图像,但微软却“拒绝”下架该工具。在测试 Copilot Designer 的安全问题和缺陷时,Jones 发现该工具会生成“与堕胎权术语相关的恶魔和怪物、手持突击步枪的青少年、暴力场景中性化的女性图像以及未成年人饮酒和吸毒

IEEE可解释AI体系架构标准P2894正式发布

可解释AI(XAI)是人工智能的一个新兴分支,用于解释人工智能所做出的每一个决策背后的逻辑,是人工智能可持续发展核心关注点之一。随着大模型时代的到来,模型变得越来越复杂,关注可解释性对于提升人工智能系统的透明度、安全性和可靠性具有重要意义。可解释AI国际标准IEEE P2894发布,打开AI“黑匣子”近期,IEEE标准协会关于可解释AI体系架构的标准P2894(Guide for an Architectural Framework for Explainable Artificial Intelligence)正

用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑

作者:赖文昕编辑:郭思、陈彩娴说起扩散模型生成的东西,你会立刻想到什么? 是OpenAI的经典牛油果椅子? 是英伟达Magic3D生成的蓝色箭毒蛙?

AI4Science的基石:几何图神经网络,最全综述来了!人大高瓴联合腾讯AI lab、清华、斯坦福等发布

编辑 | XS2023 年 11 月,Nature 连续刊登了两篇重大成果:蛋白质生成方法 Chroma 和晶体材料设计方法 GNoME,均使用了图神经网络作为科学数据的表示工具。实际上,图神经网络,特别是几何图神经网络,一直是科学智能(AI for Science)研究的重要工具。这是因为,科学领域中的粒子、分子、蛋白质、晶体等物理系统均可被建模成一种特殊的数据结构——几何图。与一般的拓扑图不同,为了更好描述物理系统,几何图加入了不可或缺的空间信息,需要满足平移、旋转和翻转的物理对称性。鉴于几何图神经网络对于物理

击败GPT-4的那群人

机器之能报道编辑:吴昕很少有人注意到 Claude 3 兼顾安全的努力以及背后深刻动机。还有他们客户群体的特点。Claude 3绘制的它自己,在社交媒体上广为流传。GPT-4 结束了“独孤求败”的日子。前几天,OpenAI 最大的竞争对手 Anthropic 发布了新一代 AI 大模型系列 —— Claude 3。该系列包含三个“杯型”,按能力由弱到强(价格由低到高)排列分别是 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。其中,能力最强的 Opus 在多项基准测试中

「还是谷歌好」,离职创业一年,我才发现训练大模型有这么多坑

Karpathy:中肯的,一针见血的。如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5 的 LLM?很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇,但真正走完「从零开始」这一流程的人很少。我们普遍认为,储备技术人才是前提,掌握核心算法是关键,但实际上,工程实践中冒出来的挑战,也实在令人头疼。一年前,乘着大模型的热潮,Yi Tay 离开了工作 3 年多的谷歌,参与创办了一家名为 Reka 的公司并担任首席科学家,主攻大型语言模型。在谷歌时,Yi T

Pieter Abbeel 新工作“大世界模型”:轻松玩转1小时长视频,一对一QA视频内容细节

作者:赖文昕编辑:陈彩娴自3天前Sora发布以来,由图灵奖得主、Meta首席科学家Yann LeCun提出的“世界模型”又一次引起了广泛关注。 “世界模型”作为Sora的一大核心亮点,被OpenAI写在技术报告中。 但Sora是否真的如Open AI所说,是一个世界模型,却引起了行业内的争论。

谷歌被曝翻车内幕:内部群龙无首,生图机制过分“多元化”

感谢IT之家网友 rolan6 的线索投递!谷歌 Gemini 文生图风波还未平,更劲爆的内幕消息又被曝出来了。Pirate Wires 爆料,Gemini 这次的翻车,谷歌内部此前并不是毫不知情,翻车甚至是“故意”导致的。具体来说,谷歌设置了一个“安全”架构,Gemini 要生成一张图实际上要经过三个模型。大概来说,流程是这样的:用户在聊天界面请求 Gemini 生成一张图片,Gemini 收到请求后,会把请求发送给一个较小的模型。这个较小的模型的作用是根据公司的“多元化”政策重写用户的提示。为做到这一点,这个较

想搞AI,高中别学数据科学:奥特曼、马斯克此刻终于一致了

高中阶段学习数据科学能不能代替数学,这个话题的讨论已经延伸到了 AI 圈。为了 AI 的发展,再不加强基础教育就晚了。在大模型技术高速发展,各家公司激烈竞争的同时,有人站出来对于未来的人才表示了担忧,焦点在于数学。近日,加州大学(UC)系统对于入学新生设立数学基础标准的消息掀起了轩然大波。随着全国范围内数学成绩的下降,一些教育工作者认为,标准的代数密集型数学教育需要改革,既可以吸引更多的学生,也可以帮助他们在日益依赖数据的未来培养相关技能。有组织称,目前至少有 17 个州已把「数据科学」作为高中数学教育的可选项,俄

Sora 时代的 AI 视频生成何去何从?

Sora 作为 OpenAI 最新发布的视频生成模型,在全球范围内引起了热烈讨论。距离上一个引发全民讨论的视频生成模型 Pika 1.0 的发布,不到三个月的时间。Sora 生成的视频有着合理的连贯性、视频主体细节足以达到以假乱真的程度。仿佛一夜之间解决了 AI 生成视频的长度、流畅性、逻辑性等问题。Sora 带来的视觉震撼,让「扔进一部小说、出来一部大片」逐步成为现实。技术的突破令人振奋,一度引发了大佬们关于世界模型的讨论,可见 Sora 早已超出了大众对技术上限的想象。与此同时,Sora 带来的恐慌和焦虑也正在

Midjourney封禁Stability AI:恶意爬取数据,致服务器瘫痪24小时

Stability AI CEO Emad 表示他并不知情。Midjourney 把 Stability AI 拉入黑名单了,禁止后者所有员工使用其软件,直至另行通知。这两家 AI 图像生成公司之间发生什么事了。虽然 AI 生图领域,看似百花齐放,但论资排辈,Midjourney、Stability AI 还是很受用户欢迎的。就算是竞争对手,Midjourney 也不至于禁止 Stability AI 员工使用其软件吧。事情是这样的,根据爆料者的信息显示:「Midjourney 服务器上周六凌晨受到与 Stabil

全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。沿袭 ViT 的研究思路,我们能否借助创新性的 LLaMA 架构,真正实现语言和图像的架构统一?在这一命题上,最近的一项研究 VisionLLaMA 取得了进展。VisionLLaMA 在图像生成(包含 Sora 依赖的底层的 DIT)和理解(分类、分割、检测、自监督)等多个主流任务上相较于原 ViT 类方法提升显著。论文标题:VisionLLaMA: A Unified LLaMA Interfac

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低 bit,以允许模型占用更少的内存开销并加快推理速度。对于具有海量参数的大语言模型而言,模型量化显得更加重要。例如,GPT-3 模型的 175B 参数当使用 FP16 格式加载时,需消耗 350GB 的内存,需要至少 5 张 80GB 的 A100 GPU。但若是可以将 GPT-3 模型的权重压缩至 3bit,则可以实现单张 A100-80GB 完成所有模型权重的加载。现有的大语言模型后训练量化算法依赖于手工制定量化参数,优于缺乏相应的优化过程,

极空间 NAS 上线“AI 实验室”功能:自然语言搜图、以图搜图、文字识别

极空间 NAS 官方宣布,全新 AI 功能 ——【AI 实验室】已正式上线,功能包括:自然语言搜索、相似图片搜索和图片文字识别。据介绍,【AI 实验室】可以帮助用户快速找出极相册中需要的图片,IT之家附内容如下:自然语言搜索智能搜图,开启后,可以使用自然语言搜索图片。点击智能 AI,开启智能搜图,在搜索框中输入文字“狗”,通过 AI 计算后,稍等片刻,就会把极相册中带“狗”的照片展示出来。相似图片搜索以图搜图,开启后,可以通过一张照片找到相似内容或是风格的其他图片。点击智能 AI,开启以图搜图,在极相册中找到一张你

阿里巴巴推出 AtomoVideo 高保真图生视频框架,兼容多种文生图模型

感谢阿里巴巴研究团队近日推出了 AtomoVideo 高保真图生视频(I2V,Image to Video)框架,旨在从静态图像生成高质量的视频内容,并与各种文生图(T2I)模型兼容。 ▲ 图源 AtomoVIdeo 团队论文IT之家总结 AtomoVideo 特性如下:高保真度:生成的视频与输入图像在细节与风格上保持高度一致性运动一致性:视频动作流畅,确保时间上的一致性,不会出现突兀的跳转视频帧预测:通过迭代预测后续帧的方式,支持长视频序列的生成兼容性:与现有的多种文生图(T2I)模型兼容高语义可控性:能够根据用

毫末Cam4DOcc入选CVPR2024:仅用摄像头做4D占据网络预测,让自动驾驶拥有时空预测能力

2024年2月27日,由毫末智行人工智能技术团队提交的论文《Cam4DOcc: Benchmark for Camera-Only 4D Occupancy Forecasting in Autonomous Driving Applications》成功入选国际顶会 CVPR 2024。毫末提出的Cam4DOcc 是一个仅使用摄像头进行 4D 占据网格预测的新基准,用来评估近期内周围场景的变化,可以将仅使用摄像头的占据网格估计扩展到时空预测,从而提升自动驾驶对周围环境在动态时间上的变化感知预测能力。首先,毫末基于

消息称新加坡主权财富基金淡马锡有意投资 OpenAI

感谢据英媒《金融时报》报道,新加坡主权财富基金淡马锡有意投资 OpenAI。淡马锡由新加坡财政部完全控股。2021 年淡马锡规模高达 3810 亿新加坡元(IT之家备注:当前约 2 万亿元人民币),与另一只新加坡政府所有的基金 GIC 一同进入主权财富基金榜单前十。两位知情人士透露,作为全球最大最活跃的投资者之一的淡马锡,其高管最近几个月多次会见了 OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)。另一位熟悉内情的人士表示,双方谈判始于对阿尔特曼的风投基金 Hydrazine Capital 的投资,