资讯列表
英伟达开源最强通用模型Nemotron-4 340B
性能超越 Llama-3,主要用于合成数据。英伟达的通用大模型 Nemotron,开源了最新的 3400 亿参数版本。本周五,英伟达宣布推出 Nemotron-4 340B。它包含一系列开放模型,开发人员可以使用这些模型生成合成数据,用于训练大语言模型(LLM),可用于医疗健康、金融、制造、零售等所有行业的商业应用。高质量的训练数据在自定义 LLM 的响应性能、准确性和质量中起着至关重要的作用 —— 但强大的数据集经常是昂贵且难以访问的。通过独特的开放模型许可,Nemotron-4 340B 为开发人员提供了一种免
有望解决一个千禧年大奖难题,这个20多年前的猜想终于得到证明
在数学抽象方面,最简单的莫过于图(graph)了。在平面上散放一些点,用线将其中一些连接起来,这就是一个图了。但图却非常强大。人们已经用它来解决各种各样的问题,从建模大脑中的神经元到为路上的送货卡车设计路径。在数学领域,图常被用于分类一种重要的代数对象,即群(group),其能以多种不同的方式来描述扭结(knot)。图论中有一个核心问题:寻找能刚好经过图中每个点一次的路径,之后再回到起点。这些路径被称为哈密顿回路(Hamiltonian cycle),得名于 19 世纪的数学家威廉・罗文・哈密顿(William R
SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]生成是生成式人工智能和计算机图形学领域最引人注目的话题之一,符合影视、游戏标准的3D生成尤其受产业界关注。在生产流程中,一般品类的3D资产往往通过手工建模或者扫描的方式制作。但作为3D
又一届「AI春晚」拉开序幕!智源大模型集体爆发了
每一年的智源大会不仅是分享前沿 AI 科技成果的平台,更为国内外业内人士提供了一个交流的舞台。果然,2024 智源大会又为我们带来了诸多惊喜。一年一度的国内「AI 春晚」—— 智源大会又一次拉开了序幕。20 个不同主题的论坛、百场精彩报告让现场和线上的观众目不暇接,切实感受到了当下 AI 尤其是大模型对内容创作、生产办公、机器人、生物医疗等千行百业的深度赋能。在这场「AI 内行顶级盛会」上,不仅有 Llama、Sora 等大模型及 DiT 架构的作者参与交流,详解他们的研究成果;还有百度、零一万物、百川智能、智谱
让鲁迅说绕口令、赫本玩嘻哈,又一视频模型火了,斯坦福华人博士创立
团队成员均来自斯坦福大学,CTO还是泰勒·斯威夫特的铁杆粉丝。AI视频领域卷疯了。Luma引发的狂欢还没结束,AI视频圈又来了个挑战者——斯坦福大学团队出品的Proteus。据介绍,Proteus 是一款低延迟基础模型,可以生成高度真实且富有表现力的人物形象。例如,让世界名画中的主角——蒙娜丽莎或者带珍珠耳环的女孩——肆无忌惮地大笑,面部表情自然流畅:让奥黛丽·赫本一改往日淑女形象,玩起嘻哈说唱: 还让《哈利·波特》中的斯内普教授唱《Despacito》:Proteus刚发布,一众大佬发来「贺信」:AI科学家贾扬清
从ALOHA迈向Humanplus,斯坦福开源人形机器人,「高配版人类」上线
人形机器人的「Hello World」。说起前段时间斯坦福开源的 Mobile ALOHA 全能家务机器人,大家肯定印象深刻,ALOHA 做起家务活来那是有模有样:滑蛋虾仁、蚝油生菜、干贝烧鸡,一会儿功夫速成大餐:研究团队来自斯坦福,由三个人共同打造完成。Zipeng Fu 为项目共同负责人,他是斯坦福大学 AI 实验室的计算机科学博士生,师从 Chelsea Finn 教授;Tony Z. Zhao 也是斯坦福大学的计算机科学博士生,导师也是 Chelsea Finn。现在,继 ALOHA 之后,Zipeng F
Mobile-Agent-v2问世,自动化手机操作能力再上新台阶
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]徐海洋,阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模型mPLUG-Owl/Owl2,多模态文档大模型mP
明年开启销售前,特斯拉计划先出租人形机器人 Optimus
特斯拉多年来一直在研发人形机器人 Optimus,并每月分享该项目的最新进展。埃隆・马斯克近期宣布,特斯拉不仅计划销售 Optimus 并将其用于自有工厂,还将提供该机器人的租赁服务。马斯克表示,特斯拉计划将提供 Optimus 机器人的租赁和销售两种选择,其中租赁服务会早于销售率先推出。根据马斯克四月份的说法,特斯拉计划明年开始销售 Optimus。目前,马斯克尚未透露有关承租方的细节信息,也没有说明消费者和其他公司如何参与到 Optimus 租赁计划中。IT之家注意到,在本周举行的特斯拉 2024 年股东大会上
一键进阶ComfyUI!懂AI的设计师现在都在用的节点式Stable Diffusion
目前使用 Stable Diffusion 进行创作的工具主要有两个:WebUI 和 ComfyUI。而更晚出现的 ComfyUI 凭借超高的可定制性和复现性迅速火遍全球。有设计师表示 SD 发布了 XL1.0 后,ComfyUI 用它优秀的底层逻辑率先打击了臃肿不稳定的 WebUI1.6,成为更适合“体验”XL 的 SD 生图工具。
本文就来具体介绍一下 ComfyUI 是什么?为什么好?怎么用?
一、ComfyUI 简介
ComfyUI 是一个专为 Stable Diffusion 设计的基于节点的图形用户界面
英伟达开源 3400 亿巨兽:98% 合成数据训出最强开源通用模型,性能对标 GPT-4o
【新智元导读】刚刚,英伟达全新发布的开源模型 Nemotron-4 340B,有可能彻底改变训练 LLM 的方式!从此,或许各行各业都不再需要昂贵的真实世界数据集了。而且,Nemotron-4 340B 直接超越了 Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2,甚至可以和 GPT-4 掰手腕!就在刚刚,英伟达再一次证明了自己的 AI 创新领域的领导地位。它全新发布的 Nemotron-4 340B,是一系列具有开创意义的开源模型,有可能彻底改变训练 LLM 的合成数据生
苹果文生图应用:仅生成卡通图片、元数据标注 AI 生成
苹果 WWDC 2024 全球开发者大会后续 The Talk Show Live 访谈中,苹果公司软件工程副总裁克雷格・费德里吉(Craig Federighi)简短地提到,iOS 将为生成的图片元数据会标注“AI 生成”。科技媒体 9to5Mac 挖掘 iOS 18 Beta 1 更新代码,在 VisualGeneration 框架中提到了用于标记和识别人工智能图像的“取证”(forensics)功能。IT之家从报道中获悉,苹果 Image Playground 应用只生成卡通化的图像,而不会生成逼真的照片,这
国际奥委会主席托马斯・巴赫:巴黎奥运期间将部署 AI 技术保护选手免受骚扰
据路透社报道,国际奥委会主席托马斯・巴赫当地时间周五表示,国际奥委会将在巴黎奥运会期间部署 AI 技术,阻止社交媒体上针对 15000 名运动员、官员的任何骚扰谩骂。IT之家注:巴黎奥运会将于 7 月 26 日拉开帷幕,10500 多名运动员将参与 32 个大项的角逐。根据国际奥委会估测,在 16 天的赛事期间将产生超过 5 亿次社交媒体互动。巴赫宣布,国际奥委会将在巴黎不同领域使用 AI 技术,其中包含了“保护”方面。他表示,如果有人只花 1 秒钟阅读一条社交内容,那么他可能需要 16 年的时间才能看完。为此,国
马斯克资源分配“偏爱”xAI,遭特斯拉投资者起诉
据 Arstechnica 报道,当地时间 14 日,一群特斯拉投资者起诉了马斯克、特斯拉公司及董事会成员,指控马斯克将资源从特斯拉转移到了他的人工智能初创公司 xAI,对特斯拉造成了损害。诉讼称,转移的资源包括从特斯拉挖走人工智能员工,将特斯拉的微芯片转移到 X(推特)和 xAI,xAI 还使用特斯拉的数据来开发自有软件 / 硬件,然而特斯拉并没有从中得到补偿。此次诉讼由三名特斯拉股东向特拉华州衡平法院提起:克利夫兰的“Cleveland Bakers and Teamsters Pension”基金会组织、丹尼
实战案例!用AIGC做一张三维质感海报原来这么简单!
前言
本次我们将运用 AIGC 制作一张和“旅游”有关的品牌海报。话不多说直接上干货!一、制作流程
制作流程如下图所示,主要由前期确认画面大致方向、AIGC 运用、后期画面优化、最终效果呈现这四个步骤组成。二、画面创意方向
本次海报制作,画面元素主要围绕关键词“旅游”进行头脑风暴。由此我们可以发散出以下几个关键词。根据以上关键词,开始在 Midjourney 输入相关关键词并进行跑图。
三、AIGC 运用
1. Midjourney 主体物提取
键词总结:旅游季海报封面,有一辆蓝色的小车载着,蓝色的天空背景,皮克斯
保姆级教程!Stable Diffusion中如何实现模特换装?
一、如何用 AI 换装?
直接进入教程,我们将会用到 Stable Diffusion WebUI 中安装的 Inpaint Anything 扩展,如果你还没有 SD 本地环境,可以先查看其他配置本地 SD 环境(安装实在是太复杂了,对 Mac 用户也不友好)或者使用一些在线的 Stable Diffusion WebUI 工具。第 1 步:上传图片到 Inpaint Anything 中点击 Inpaint Anything 标签页下,将图片拖动到输入图像框中。
第 2 步:运行分割模型
等待图片上传完成后,点
限时售价21.99万起! 岚图FREE 318 正式上市
6月14日晚,岚图FREE 318上市发布会于四川雅安318·川藏线零公里大本营举行。岚图FREE 318正式上市,共推出两大版型,后驱环游版首销期售价21.99万元;四驱探索版首销期售价24.79万元。岚图还同时推出了价值近3万元的多重惊喜权益。岚图汽车CEO卢放表示:“科技兴则民族兴,科技强则国家强。我们坚持牢牢掌握关键核心技术,用技术打造高质量产品。岚图在关键技术应用上实现进一步突破,为岚图FREE 318多维度焕新升级打下坚实基础。同时,作为用户型科技企业,未来岚图将以技术创新为引领,不断深入洞察用户诉求,
腾讯混元联合港科大及清华推出「Follow Your Emoji」, 一键让照片变表情包
图生视频又有新玩法。腾讯混元联合港科大、清华大学联合推出肖像动画生成框架「Follow Your Emoji」,可以通过人脸骨架信息生成任意风格的脸部动画,一键创建“表情包”。基于算法革新和数据积累,「Follow Your Emoji」可以支持对脸部进行精细化的控制,包括眉毛,眼珠,翻白眼等细节,动物表情包也可以轻松“拿捏”。Follow Your Emoji不仅支持单个表情多肖像的生成,也支持单个肖像多表情的生成。近年来,扩散模型展示了比旧的对抗式(GAN)方法更好的生成能力。一些方法利用强大的基础扩散模型进行
WAIC 2024算力合辑|“算”启未来,筑牢AI算力底座,赋能千行百业
网络无处不达,算力无所不在。在数智时代,算力正像水力、电力一样,渗透进生产生活的各个角落,赋能作用日益凸显。从AI芯片到云计算,作为人工智能发展的重要“底座”,算力技术在云端、边缘和端侧等不同应用场景中发挥着关键作用。通过完善数据要素市场,夯实算力基础设施建设,打造互联互通的算力网络,“算赋百业”不再只是设想。2024世界人工智能大会暨人工智能全球治理高级别会议(以下简称“WAIC 2024”)将聚焦算力的发展,展现该领域的前沿成果,打造产业生态雨林。同时,展区将汇聚顶尖算力企业,并带来最新智算产品。大会期间,还将