应用

SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]生成是生成式人工智能和计算机图形学领域最引人注目的话题之一,符合影视、游戏标准的3D生成尤其受产业界关注。在生产流程中,一般品类的3D资产往往通过手工建模或者扫描的方式制作。但作为3D

又一届「AI春晚」拉开序幕!智源大模型集体爆发了

每一年的智源大会不仅是分享前沿 AI 科技成果的平台,更为国内外业内人士提供了一个交流的舞台。果然,2024 智源大会又为我们带来了诸多惊喜。一年一度的国内「AI 春晚」—— 智源大会又一次拉开了序幕。20 个不同主题的论坛、百场精彩报告让现场和线上的观众目不暇接,切实感受到了当下 AI 尤其是大模型对内容创作、生产办公、机器人、生物医疗等千行百业的深度赋能。在这场「AI 内行顶级盛会」上,不仅有 Llama、Sora 等大模型及 DiT 架构的作者参与交流,详解他们的研究成果;还有百度、零一万物、百川智能、智谱

让鲁迅说绕口令、赫本玩嘻哈,又一视频模型火了,斯坦福华人博士创立

团队成员均来自斯坦福大学,CTO还是泰勒·斯威夫特的铁杆粉丝。AI视频领域卷疯了。Luma引发的狂欢还没结束,AI视频圈又来了个挑战者——斯坦福大学团队出品的Proteus。据介绍,Proteus 是一款低延迟基础模型,可以生成高度真实且富有表现力的人物形象。例如,让世界名画中的主角——蒙娜丽莎或者带珍珠耳环的女孩——肆无忌惮地大笑,面部表情自然流畅:让奥黛丽·赫本一改往日淑女形象,玩起嘻哈说唱: 还让《哈利·波特》中的斯内普教授唱《Despacito》:Proteus刚发布,一众大佬发来「贺信」:AI科学家贾扬清

从ALOHA迈向Humanplus,斯坦福开源人形机器人,「高配版人类」上线

人形机器人的「Hello World」。说起前段时间斯坦福开源的 Mobile ALOHA 全能家务机器人,大家肯定印象深刻,ALOHA 做起家务活来那是有模有样:滑蛋虾仁、蚝油生菜、干贝烧鸡,一会儿功夫速成大餐:研究团队来自斯坦福,由三个人共同打造完成。Zipeng Fu 为项目共同负责人,他是斯坦福大学 AI 实验室的计算机科学博士生,师从 Chelsea Finn 教授;Tony Z. Zhao 也是斯坦福大学的计算机科学博士生,导师也是 Chelsea Finn。现在,继 ALOHA 之后,Zipeng F

Mobile-Agent-v2问世,自动化手机操作能力再上新台阶

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]徐海洋,阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模型mPLUG-Owl/Owl2,多模态文档大模型mP

明年开启销售前,特斯拉计划先出租人形机器人 Optimus

特斯拉多年来一直在研发人形机器人 Optimus,并每月分享该项目的最新进展。埃隆・马斯克近期宣布,特斯拉不仅计划销售 Optimus 并将其用于自有工厂,还将提供该机器人的租赁服务。马斯克表示,特斯拉计划将提供 Optimus 机器人的租赁和销售两种选择,其中租赁服务会早于销售率先推出。根据马斯克四月份的说法,特斯拉计划明年开始销售 Optimus。目前,马斯克尚未透露有关承租方的细节信息,也没有说明消费者和其他公司如何参与到 Optimus 租赁计划中。IT之家注意到,在本周举行的特斯拉 2024 年股东大会上

一键进阶ComfyUI!懂AI的设计师现在都在用的节点式Stable Diffusion

目前使用 Stable Diffusion 进行创作的工具主要有两个:WebUI 和 ComfyUI。而更晚出现的 ComfyUI 凭借超高的可定制性和复现性迅速火遍全球。有设计师表示 SD 发布了 XL1.0 后,ComfyUI 用它优秀的底层逻辑率先打击了臃肿不稳定的 WebUI1.6,成为更适合“体验”XL 的 SD 生图工具。 本文就来具体介绍一下 ComfyUI 是什么?为什么好?怎么用? 一、ComfyUI 简介 ComfyUI 是一个专为 Stable Diffusion 设计的基于节点的图形用户界面

国际奥委会主席托马斯・巴赫:巴黎奥运期间将部署 AI 技术保护选手免受骚扰

据路透社报道,国际奥委会主席托马斯・巴赫当地时间周五表示,国际奥委会将在巴黎奥运会期间部署 AI 技术,阻止社交媒体上针对 15000 名运动员、官员的任何骚扰谩骂。IT之家注:巴黎奥运会将于 7 月 26 日拉开帷幕,10500 多名运动员将参与 32 个大项的角逐。根据国际奥委会估测,在 16 天的赛事期间将产生超过 5 亿次社交媒体互动。巴赫宣布,国际奥委会将在巴黎不同领域使用 AI 技术,其中包含了“保护”方面。他表示,如果有人只花 1 秒钟阅读一条社交内容,那么他可能需要 16 年的时间才能看完。为此,国

马斯克资源分配“偏爱”xAI,遭特斯拉投资者起诉

据 Arstechnica 报道,当地时间 14 日,一群特斯拉投资者起诉了马斯克、特斯拉公司及董事会成员,指控马斯克将资源从特斯拉转移到了他的人工智能初创公司 xAI,对特斯拉造成了损害。诉讼称,转移的资源包括从特斯拉挖走人工智能员工,将特斯拉的微芯片转移到 X(推特)和 xAI,xAI 还使用特斯拉的数据来开发自有软件 / 硬件,然而特斯拉并没有从中得到补偿。此次诉讼由三名特斯拉股东向特拉华州衡平法院提起:克利夫兰的“Cleveland Bakers and Teamsters Pension”基金会组织、丹尼

实战案例!用AIGC做一张三维质感海报原来这么简单!

前言 本次我们将运用 AIGC 制作一张和“旅游”有关的品牌海报。话不多说直接上干货!一、制作流程 制作流程如下图所示,主要由前期确认画面大致方向、AIGC 运用、后期画面优化、最终效果呈现这四个步骤组成。二、画面创意方向 本次海报制作,画面元素主要围绕关键词“旅游”进行头脑风暴。由此我们可以发散出以下几个关键词。根据以上关键词,开始在 Midjourney 输入相关关键词并进行跑图。 三、AIGC 运用 1. Midjourney 主体物提取 键词总结:旅游季海报封面,有一辆蓝色的小车载着,蓝色的天空背景,皮克斯

保姆级教程!Stable Diffusion中如何实现模特换装?

一、如何用 AI 换装? 直接进入教程,我们将会用到 Stable Diffusion WebUI 中安装的 Inpaint Anything 扩展,如果你还没有 SD 本地环境,可以先查看其他配置本地 SD 环境(安装实在是太复杂了,对 Mac 用户也不友好)或者使用一些在线的 Stable Diffusion WebUI 工具。第 1 步:上传图片到 Inpaint Anything 中点击 Inpaint Anything 标签页下,将图片拖动到输入图像框中。 第 2 步:运行分割模型 等待图片上传完成后,点

限时售价21.99万起! 岚图FREE 318 正式上市

6月14日晚,岚图FREE 318上市发布会于四川雅安318·川藏线零公里大本营举行。岚图FREE 318正式上市,共推出两大版型,后驱环游版首销期售价21.99万元;四驱探索版首销期售价24.79万元。岚图还同时推出了价值近3万元的多重惊喜权益。岚图汽车CEO卢放表示:“科技兴则民族兴,科技强则国家强。我们坚持牢牢掌握关键核心技术,用技术打造高质量产品。岚图在关键技术应用上实现进一步突破,为岚图FREE 318多维度焕新升级打下坚实基础。同时,作为用户型科技企业,未来岚图将以技术创新为引领,不断深入洞察用户诉求,

腾讯混元联合港科大及清华推出「Follow Your Emoji」, 一键让照片变表情包

图生视频又有新玩法。腾讯混元联合港科大、清华大学联合推出肖像动画生成框架「Follow Your Emoji」,可以通过人脸骨架信息生成任意风格的脸部动画,一键创建“表情包”。基于算法革新和数据积累,「Follow Your Emoji」可以支持对脸部进行精细化的控制,包括眉毛,眼珠,翻白眼等细节,动物表情包也可以轻松“拿捏”。Follow Your Emoji不仅支持单个表情多肖像的生成,也支持单个肖像多表情的生成。近年来,扩散模型展示了比旧的对抗式(GAN)方法更好的生成能力。一些方法利用强大的基础扩散模型进行

WAIC 2024算力合辑|“算”启未来,筑牢AI算力底座,赋能千行百业

网络无处不达,算力无所不在。在数智时代,算力正像水力、电力一样,渗透进生产生活的各个角落,赋能作用日益凸显。从AI芯片到云计算,作为人工智能发展的重要“底座”,算力技术在云端、边缘和端侧等不同应用场景中发挥着关键作用。通过完善数据要素市场,夯实算力基础设施建设,打造互联互通的算力网络,“算赋百业”不再只是设想。2024世界人工智能大会暨人工智能全球治理高级别会议(以下简称“WAIC 2024”)将聚焦算力的发展,展现该领域的前沿成果,打造产业生态雨林。同时,展区将汇聚顶尖算力企业,并带来最新智算产品。大会期间,还将

论坛预告|前瞻未来,共创辉煌——WAIC 2024中阿人工智能产业金融合作论坛即将启幕

全球瞩目的2024世界人工智能大会暨人工智能全球治理高级别会议即将拉开帷幕,作为大会国际论坛板块的亮点之一,中阿人工智能产业金融合作论坛蓄势待发,将于7月6日上午在世博展览馆X会议室隆重召开。本次论坛以“开启中阿人工智能创新合作新篇章”为主题,由阿联酋中国创新中心(CIC)主办,获得了哈伊马角数字资产绿洲自由区、迪拜综合经济区管理局、迪拜资本俱乐部等重量级机构的鼎力支持,旨在构建中阿人工智能产业合作的新桥梁。深化合作,携手前行中阿双方近期发表的《联合声明》强调了两国在创新、数字经济、科学、开源项目孵化与商业落地、清

Microsoft AI Day:支持开放合作,普及技术应用, 推进行业企业智慧化创新

共创AI创新,智启无限可能。

登Nature,大脑如何控制运动?DeepMind设计拥有「AI大脑」的虚拟动物

编辑 | 萝卜皮动物对身体的控制十分精妙,因此能够做出各种各样的行为。然而,大脑如何实现这种控制仍不清楚。要加深我们的理解,就需要能够将控制原理与动物的神经活动结构联系起来的模型。为了实现这一点,哈佛大学、谷歌 DeepMind 的研究人员构建了一个「虚拟啮齿动物」,使用人工神经网络在物理模拟器中驱动大鼠的生物力学仿真模型。该团队使用深度强化学习来训练虚拟代理模仿自由活动的老鼠的行为,从而让研究人员能够将「真实老鼠记录的神经活动」与模仿其行为的「虚拟啮齿动物的网络活动」进行比较。模型能够准确模仿真实老鼠的运动,这一

「东数西算」再添重要节点,华为云芜湖数据中心正式开服

华为云在芜湖建设数据中心,与贵州贵安、内蒙古乌兰察布一起构成了华为云的算力“铁三角”,基于先进技术构建了“AI算力一张网”。