AI资讯列表 - AI在线

英伟达开源最强通用模型Nemotron-4 340B

性能超越 Llama-3，主要用于合成数据。英伟达的通用大模型 Nemotron，开源了最新的 3400 亿参数版本。本周五，英伟达宣布推出 Nemotron-4 340B。它包含一系列开放模型，开发人员可以使用这些模型生成合成数据，用于训练大语言模型（LLM），可用于医疗健康、金融、制造、零售等所有行业的商业应用。高质量的训练数据在自定义 LLM 的响应性能、准确性和质量中起着至关重要的作用 —— 但强大的数据集经常是昂贵且难以访问的。通过独特的开放模型许可，Nemotron-4 340B 为开发人员提供了一种免

有望解决一个千禧年大奖难题，这个20多年前的猜想终于得到证明

在数学抽象方面，最简单的莫过于图（graph）了。在平面上散放一些点，用线将其中一些连接起来，这就是一个图了。但图却非常强大。人们已经用它来解决各种各样的问题，从建模大脑中的神经元到为路上的送货卡车设计路径。在数学领域，图常被用于分类一种重要的代数对象，即群（group），其能以多种不同的方式来描述扭结（knot）。图论中有一个核心问题：寻找能刚好经过图中每个点一次的路径，之后再回到起点。这些路径被称为哈密顿回路（Hamiltonian cycle），得名于 19 世纪的数学家威廉・罗文・哈密顿（William R

SIGGRAPH2024｜上科大、影眸联合提出DressCode：从文本生成3D服装板片

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]生成是生成式人工智能和计算机图形学领域最引人注目的话题之一，符合影视、游戏标准的3D生成尤其受产业界关注。在生产流程中，一般品类的3D资产往往通过手工建模或者扫描的方式制作。但作为3D

又一届「AI春晚」拉开序幕！智源大模型集体爆发了

每一年的智源大会不仅是分享前沿 AI 科技成果的平台，更为国内外业内人士提供了一个交流的舞台。果然，2024 智源大会又为我们带来了诸多惊喜。一年一度的国内「AI 春晚」—— 智源大会又一次拉开了序幕。20 个不同主题的论坛、百场精彩报告让现场和线上的观众目不暇接，切实感受到了当下 AI 尤其是大模型对内容创作、生产办公、机器人、生物医疗等千行百业的深度赋能。在这场「AI 内行顶级盛会」上，不仅有 Llama、Sora 等大模型及 DiT 架构的作者参与交流，详解他们的研究成果；还有百度、零一万物、百川智能、智谱

让鲁迅说绕口令、赫本玩嘻哈，又一视频模型火了，斯坦福华人博士创立

团队成员均来自斯坦福大学，CTO还是泰勒·斯威夫特的铁杆粉丝。AI视频领域卷疯了。Luma引发的狂欢还没结束，AI视频圈又来了个挑战者——斯坦福大学团队出品的Proteus。据介绍，Proteus 是一款低延迟基础模型，可以生成高度真实且富有表现力的人物形象。例如，让世界名画中的主角——蒙娜丽莎或者带珍珠耳环的女孩——肆无忌惮地大笑，面部表情自然流畅：让奥黛丽·赫本一改往日淑女形象，玩起嘻哈说唱：还让《哈利·波特》中的斯内普教授唱《Despacito》：Proteus刚发布，一众大佬发来「贺信」：AI科学家贾扬清

从ALOHA迈向Humanplus，斯坦福开源人形机器人，「高配版人类」上线

人形机器人的「Hello World」。说起前段时间斯坦福开源的 Mobile ALOHA 全能家务机器人，大家肯定印象深刻，ALOHA 做起家务活来那是有模有样：滑蛋虾仁、蚝油生菜、干贝烧鸡，一会儿功夫速成大餐：研究团队来自斯坦福，由三个人共同打造完成。Zipeng Fu 为项目共同负责人，他是斯坦福大学 AI 实验室的计算机科学博士生，师从 Chelsea Finn 教授；Tony Z. Zhao 也是斯坦福大学的计算机科学博士生，导师也是 Chelsea Finn。现在，继 ALOHA 之后，Zipeng F

Mobile-Agent-v2问世，自动化手机操作能力再上新台阶

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]徐海洋，阿里通义实验室高级算法专家，负责通义多模态大模型mPLUG系列工作，包括基础多模态模型mPLUG/mPLUG-2，多模态对话大模型mPLUG-Owl/Owl2，多模态文档大模型mP

明年开启销售前，特斯拉计划先出租人形机器人 Optimus

特斯拉多年来一直在研发人形机器人 Optimus，并每月分享该项目的最新进展。埃隆・马斯克近期宣布，特斯拉不仅计划销售 Optimus 并将其用于自有工厂，还将提供该机器人的租赁服务。马斯克表示，特斯拉计划将提供 Optimus 机器人的租赁和销售两种选择，其中租赁服务会早于销售率先推出。根据马斯克四月份的说法，特斯拉计划明年开始销售 Optimus。目前，马斯克尚未透露有关承租方的细节信息，也没有说明消费者和其他公司如何参与到 Optimus 租赁计划中。IT之家注意到，在本周举行的特斯拉 2024 年股东大会上

一键进阶ComfyUI！懂AI的设计师现在都在用的节点式Stable Diffusion

目前使用 Stable Diffusion 进行创作的工具主要有两个：WebUI 和 ComfyUI。而更晚出现的 ComfyUI 凭借超高的可定制性和复现性迅速火遍全球。有设计师表示 SD 发布了 XL1.0 后，ComfyUI 用它优秀的底层逻辑率先打击了臃肿不稳定的 WebUI1.6，成为更适合“体验”XL 的 SD 生图工具。本文就来具体介绍一下 ComfyUI 是什么？为什么好？怎么用？一、ComfyUI 简介 ComfyUI 是一个专为 Stable Diffusion 设计的基于节点的图形用户界面

英伟达开源 3400 亿巨兽：98% 合成数据训出最强开源通用模型，性能对标 GPT-4o

【新智元导读】刚刚，英伟达全新发布的开源模型 Nemotron-4 340B，有可能彻底改变训练 LLM 的方式！从此，或许各行各业都不再需要昂贵的真实世界数据集了。而且，Nemotron-4 340B 直接超越了 Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2，甚至可以和 GPT-4 掰手腕！就在刚刚，英伟达再一次证明了自己的 AI 创新领域的领导地位。它全新发布的 Nemotron-4 340B，是一系列具有开创意义的开源模型，有可能彻底改变训练 LLM 的合成数据生

苹果文生图应用：仅生成卡通图片、元数据标注 AI 生成

苹果 WWDC 2024 全球开发者大会后续 The Talk Show Live 访谈中，苹果公司软件工程副总裁克雷格・费德里吉（Craig Federighi）简短地提到，iOS 将为生成的图片元数据会标注“AI 生成”。科技媒体 9to5Mac 挖掘 iOS 18 Beta 1 更新代码，在 VisualGeneration 框架中提到了用于标记和识别人工智能图像的“取证”（forensics）功能。IT之家从报道中获悉，苹果 Image Playground 应用只生成卡通化的图像，而不会生成逼真的照片，这

国际奥委会主席托马斯・巴赫：巴黎奥运期间将部署 AI 技术保护选手免受骚扰

据路透社报道，国际奥委会主席托马斯・巴赫当地时间周五表示，国际奥委会将在巴黎奥运会期间部署 AI 技术，阻止社交媒体上针对 15000 名运动员、官员的任何骚扰谩骂。IT之家注：巴黎奥运会将于 7 月 26 日拉开帷幕，10500 多名运动员将参与 32 个大项的角逐。根据国际奥委会估测，在 16 天的赛事期间将产生超过 5 亿次社交媒体互动。巴赫宣布，国际奥委会将在巴黎不同领域使用 AI 技术，其中包含了“保护”方面。他表示，如果有人只花 1 秒钟阅读一条社交内容，那么他可能需要 16 年的时间才能看完。为此，国

马斯克资源分配“偏爱”xAI，遭特斯拉投资者起诉

据 Arstechnica 报道，当地时间 14 日，一群特斯拉投资者起诉了马斯克、特斯拉公司及董事会成员，指控马斯克将资源从特斯拉转移到了他的人工智能初创公司 xAI，对特斯拉造成了损害。诉讼称，转移的资源包括从特斯拉挖走人工智能员工，将特斯拉的微芯片转移到 X（推特）和 xAI，xAI 还使用特斯拉的数据来开发自有软件 / 硬件，然而特斯拉并没有从中得到补偿。此次诉讼由三名特斯拉股东向特拉华州衡平法院提起：克利夫兰的“Cleveland Bakers and Teamsters Pension”基金会组织、丹尼

实战案例！用AIGC做一张三维质感海报原来这么简单！

前言本次我们将运用 AIGC 制作一张和“旅游”有关的品牌海报。话不多说直接上干货！一、制作流程制作流程如下图所示，主要由前期确认画面大致方向、AIGC 运用、后期画面优化、最终效果呈现这四个步骤组成。二、画面创意方向本次海报制作，画面元素主要围绕关键词“旅游”进行头脑风暴。由此我们可以发散出以下几个关键词。根据以上关键词，开始在 Midjourney 输入相关关键词并进行跑图。三、AIGC 运用 1. Midjourney 主体物提取键词总结：旅游季海报封面，有一辆蓝色的小车载着，蓝色的天空背景，皮克斯

保姆级教程！Stable Diffusion中如何实现模特换装？

一、如何用 AI 换装？直接进入教程，我们将会用到 Stable Diffusion WebUI 中安装的 Inpaint Anything 扩展，如果你还没有 SD 本地环境，可以先查看其他配置本地 SD 环境（安装实在是太复杂了，对 Mac 用户也不友好）或者使用一些在线的 Stable Diffusion WebUI 工具。第 1 步：上传图片到 Inpaint Anything 中点击 Inpaint Anything 标签页下，将图片拖动到输入图像框中。第 2 步：运行分割模型等待图片上传完成后，点

限时售价21.99万起！岚图FREE 318 正式上市

6月14日晚，岚图FREE 318上市发布会于四川雅安318·川藏线零公里大本营举行。岚图FREE 318正式上市，共推出两大版型，后驱环游版首销期售价21.99万元；四驱探索版首销期售价24.79万元。岚图还同时推出了价值近3万元的多重惊喜权益。岚图汽车CEO卢放表示：“科技兴则民族兴，科技强则国家强。我们坚持牢牢掌握关键核心技术，用技术打造高质量产品。岚图在关键技术应用上实现进一步突破，为岚图FREE 318多维度焕新升级打下坚实基础。同时，作为用户型科技企业，未来岚图将以技术创新为引领，不断深入洞察用户诉求，

腾讯混元联合港科大及清华推出「Follow Your Emoji」，一键让照片变表情包

图生视频又有新玩法。腾讯混元联合港科大、清华大学联合推出肖像动画生成框架「Follow Your Emoji」，可以通过人脸骨架信息生成任意风格的脸部动画，一键创建“表情包”。基于算法革新和数据积累，「Follow Your Emoji」可以支持对脸部进行精细化的控制，包括眉毛，眼珠，翻白眼等细节，动物表情包也可以轻松“拿捏”。Follow Your Emoji不仅支持单个表情多肖像的生成，也支持单个肖像多表情的生成。近年来，扩散模型展示了比旧的对抗式（GAN）方法更好的生成能力。一些方法利用强大的基础扩散模型进行

WAIC 2024算力合辑｜“算”启未来，筑牢AI算力底座，赋能千行百业

网络无处不达，算力无所不在。在数智时代，算力正像水力、电力一样，渗透进生产生活的各个角落，赋能作用日益凸显。从AI芯片到云计算，作为人工智能发展的重要“底座”，算力技术在云端、边缘和端侧等不同应用场景中发挥着关键作用。通过完善数据要素市场，夯实算力基础设施建设，打造互联互通的算力网络，“算赋百业”不再只是设想。2024世界人工智能大会暨人工智能全球治理高级别会议（以下简称“WAIC 2024”）将聚焦算力的发展，展现该领域的前沿成果，打造产业生态雨林。同时，展区将汇聚顶尖算力企业，并带来最新智算产品。大会期间，还将

资讯列表