资讯列表
特斯拉为 Optimus 人形机器人招募“人类老师”:高薪重体力活
特斯拉正在招募大量人员,通过穿戴动作捕捉设备模仿机器人所需动作来训练其人形机器人 Optimus。这个被特斯拉称为“数据采集员”的职位时薪高达 48 美元(AI在线备注:当前约 344 元人民币),要求员工每天步行超过 7 小时,携带重达 30 磅(约 13.61 千克)的设备,并长时间佩戴 VR 头显。为了与预计身高为 5 英尺 8 英寸(约 1.72 米)的 Optimus 身形相近,应聘者身高需在 5 英尺 7 英寸(约 1.7 米)到 5 英尺 11 英寸(约 1.8 米)之间。特斯拉官方 Optimus
Flux.1 生态最新梳理!新增 4 款新模型,支持 Controlnet 和 Lora (附模型/工作流文件)
大家好我是花生~
绘画模型 Flux.1 自推出后,以其超强的图像生成能力迅速受到广泛关注,一跃成为新一代的 AI 文生图模型标杆。 虽然 Flux.1 dev / schnell 模型开源还不到 1 个月,但围绕其进行的生态建设却发展迅猛:目前已经出现了至少 4 种不同的模型版本和几百款 checkpoint 、lora 模型,配套的 controlnet 模型也已经上线,各种基于 flux 的文生图、图生图、高清放大、局部重绘、面部修复工作流也投入了使用,让人惊叹于开源社区强大的生命力。生态能发展完善肯定是好事
人形机器人加入新玩家?消息称地平线公司组建约 50 人具身智能团队
据“晚点 LatePost”报道,自动驾驶计算方案公司地平线已组建了一个约 50 人的具身智能团队,负责人为地平线副总裁、前软件平台产品线总裁余轶南。报道称,余轶南 2015 年加入地平线,是地平线最早创始人团队之一,曾任百度深度学习研究院科学家,是百度-清华联合培养博士,其导师就是地平线创始人、CEO 余凯。该团队主要负责人还有地平线原智能驾驶感知研发部负责人苏治中,他于 2017 年加入地平线,曾是百度深度学习研究院(IDL)的初始成员之一。余轶南和苏治中为平级,向余凯汇报。AI在线从公开资料获悉,具身智能是人
阿里通义千问宣布启用新域名“tongyi.ai”,网页版聊天新增深度搜索功能
感谢阿里大语言模型“通义千问”今日宣布启用新域名“tongyi.ai”,并带来多项新功能。AI在线整理如下:网页版聊天新增深度搜索功能:支持更多内容源索引,搜索结果更加深度、专业和结构化,数字角标悬浮显示来源网页。App 图片微动效支持多尺寸图片:进入通义 App 频道页,选择「图片微动效」,需要上传一张图片,即可生成与画面匹配的音效及微动视频效果。App 自定义唱演支持 3:4 画幅(原先 1:1):音频的上传逻辑进行调整,将时长由 120S 提高到 300S。阿里云在 8 月 8 日的万网焕新发布会上宣布,域名
AI在用 | AI卷起「穷鬼健身」,15天涨粉上万
机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。投稿邮箱:[email protected]日本国民女神天海佑希有句名言:男人会背叛你,但肌肉不会。网友纷纷评论:女王发言、人间清醒……视频链接:,健身圈也卷到不行。什么直角肩、马甲线、双开门…… 为了练出好身材,年轻人们拼了
昆仑万维推出全球首款 AI 短剧平台 SkyReels,「一人一剧」时代来临
8月19日,昆仑万维发布全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。SkyReels平台集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成于一体,让创作者一键成剧,轻松制作高质量AI视频。这是一个2分半时长的短剧作品。「 我们应该放下固化和抵抗的思维,拥抱这个碎片化信息时代。」 2023 年 12 月初,导演黄建新在北京电影学院北影大讲堂上感慨,比起电影,竖屏短剧兴起才真正形成了全球输出。 几分钟到十几分钟的单集时长、强烈的娱乐性和快节奏剧情,频繁踩中用户「爽点」,短短三年(到 2023
国内首个UI大模型出炉!Motiff妙多大模型打造设计师最佳助手、优化UI设计工作流
人工智能的发展速度可能超乎你的想象。自GPT-4将多模态技术引入公众视野以来,多模态大模型进入快速发展阶段,逐渐从单纯的模型研发转向垂直领域的探索和应用,与各行各业深度融合。在界面交互领域,谷歌、苹果等国际科技巨头纷纷投入UI多模态大模型研发,这被视为手机AI革命的必经之路。在此背景下,国内首个UI大模型横空出世。8月17日,在IXDC2024国际体验设计大会上,AI时代设计工具Motiff妙多推出了其自主研发的UI多模态大模型——Motiff妙多大模型。这是全球首个由UI设计工具企业研发的大模型,标志着中国UI设
为什么学线代时不知道:矩阵与图竟然存在等价关系
矩阵很难理解,但换个视角或许会不一样。在学习数学时,我们常因所学知识的难度和抽象而受挫;但有些时候,只需换个角度,我们就能为问题的解答找到一个简单又直观的解法。举个例子,小时候在学习和的平方 (a b)² 公式时,我们可能并不理解为什么它等于 a² 2ab b²,只知道书上这么写,老师让这么记;直到某天我们看见了这张动图:登时恍然大悟,原来我们可以从几何角度来理解它!现在,这种恍然大悟之感又出现了:非负矩阵可以等价地转换成对应的有向图!如下图所示,左侧的 3×3 矩阵其实可以等价地表示成右侧的包含三个节点的有向图,
Nature子刊,上智院、复旦、中国气象局研发次季节AI大模型「伏羲」,突破「可预报性沙漠」
编辑 | ScienceAI作者 | 伏羲团队国务院印发的《气象高质量发展纲要(2022—2035 年)》明确提出要「提前一个月预报重大天气过程」,而这离不开 15 天以上的次季节气候预测技术。次季节气候预测关注的是未来 15~60 天的气候异常,可以为农业、水利、能源等领域的生产安排提供重要支撑。相比时效在两周以内的中短期天气预报,次季节气候预测的不确定性更大。它不仅需要考虑初值问题,还要考虑边界强迫的影响,预测来源更为复杂,预测技巧也较少。因此,次季节气候预测一直被称为「可预报性沙漠」,由于其复杂性,甚至连 A
大模型终端部署新趋势:硬件直接支持混合矩阵乘法
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]在人工智能领域,模型参数的增多往往意味着性能的提升。但随着模型规模的扩大,其对终端设备的算力与内存需求也日益增加。低比特量化技术,由于可以大幅降低存储和计算成本并提升推理效率,已成为实现大
Consensus CEO 回应阿尔特曼“碾压”初创言论:从“套壳”开始也能做出伟大产品
OpenAI 就像是悬在 AI 初创公司头上的达摩克利斯之剑,可这在多大程度上是真实的,亦或是阿尔特曼的自我标榜?这篇文章击碎了科技巨头的滤镜,并试图为套壳 GPT 正名。这个时代的 AI 创业者最担心的一件事,莫过于自己的产品遭遇上「正规军」的突袭;最怕听到的一句话,恐怕是「你这个是套壳应用吧」。好一点的创业公司,等待着被收购,比如前段时间卖身谷歌的 Character.ai。运气没那么好的,则纷纷死在了 OpenAI 等 AI 巨头产品发布会的前夜,徒留下一句保命箴言警示后来者 ——不要去做巨头迟早会做的事情,
机器人策略学习的Game Changer?伯克利提出Body Transformer
过去几年间,Transformer 架构已经取得了巨大的成功,同时其也衍生出了大量变体,比如擅长处理视觉任务的 Vision Transformer(ViT)。本文要介绍的 Body Transformer(BoT) 则是非常适合机器人策略学习的 Transformer 变体。我们知道,物理智能体在执行动作的校正和稳定时,往往会根据其感受到的外部刺激的位置给出空间上的响应。比如人类对这些刺激的响应回路位于脊髓神经回路层面,它们专门负责单个执行器的响应。起校正作用的局部执行是高效运动的主要因素,这对机器人来说也尤为重
麦当劳请了 11 个 AI 美女为薯条打 Call,引来近千万观看
麦当劳用 AI 制作的宣传片火了!仅在推特一个平台,这段 16 秒的视频就获得了近千万的浏览量,而且一直在增长。先来看效果:这则广告内容是关于日本麦当劳即将举行的薯条优惠活动,作者是知名 AI 艺术家 Kaku Drop 架空飴(AI在线备注读音:yí 或 sì)。作者和麦当劳都没交代具体用的是哪款 AI 工具,但这段宣传片被 Luma 的账号转发了。这个 Luma 就是爆火的“Sora 竞品”模型 Dream Machine 的出品公司,由前苹果工程师 Amit Jain 创立,还获得过英伟达的投资。有网友看到之
ChatGPT 成 8 岁娃“导师”,各国中小学成 AI 坚实用户群体
GenAI 的这股风不知不觉也刮到了学校课堂中。根据外媒报道,美国、英国、韩国等地的中小学逐渐开始推行「AI 教育变革」。为什么被一众大学禁止的 ChatGPT 类 AI 工具,反而要在中小学推广?虽然 OpenAI 还没靠 AI 大模型真正实现盈利,GenAI 已经迎来了一个坚实的用户群体 —— 各国的中小学。根据《金融时报》、《华盛顿邮报》、《纽约时报》等多家媒体的报道,已经有不止一个国家和地区计划在中小学课堂上使用 AI 辅助教学。AI 走入中小学课堂伦敦的一所私立学校 David Game College
智元发布商用人形全家桶,双足10月开始量产,今年出货200台
8月18日,智元机器人举行“智元远征 商用启航” 2024年度新品发布会,智元联合创始人彭志辉主持并发布了“远征”与“灵犀”两大系列共五款商用人形机器人新品——远征A2、远征A2-W、远征A2-Max、灵犀X1及灵犀X1-W,并展示了在机器人动力、感知、通信、控制四大领域的自主研发成果,以及具身智能G1到G5技术路线图和AIDEA具身智能数据系统。 此次发布会上,智元机器人宣布了一系列重磅开源计划,包括:智能机器人高性能通信框架AimRT将于9月底开源,由X-Lab孵化的灵犀X1将于9月份陆续全栈开源,同时预告了基于AIDEA的百万条真机、千万条仿真数据集将在今年四季度开源。 智元联合创始人 彭志辉五款新品,全场景深度覆盖五款机器人采用了家族化设计语言,结合轮式与足式两种形态,覆盖交互服务、柔性智造、特种作业、科研教育和数据采集等应用场景。
科大讯飞推出“星火极速超拟人交互”:可模仿孙悟空、蜡笔小新、小猪佩奇等音色、语气、人设
感谢科大讯飞今日宣布对星火语音大模型进行更新,带来“星火极速超拟人交互”,计划于 8 月 30 日上线讯飞星火 App。“星火极速超拟人交互”采用统一神经网络实现语音到语音的端到端建模。官方称即便被频繁打断,也能“迅速反应”,更加符合日常对话情境。升级后的版本可以针对高兴、悲伤、生气、害怕等情绪进行识别;自动带入符合情境的对话,用合适的情绪语气进行回复。据介绍,“星火极速超拟人交互”的情感表达“更灵活”,可以在交流中跟随用户指令控制数十种情感、风格、方言,支持调节语速。“星火极速超拟人交互”能够模仿包括孙悟空、蜡笔
昆仑万维发布 AI 短剧平台 SkyReels:可生成剧情 / 对白,号称让创作者“一键成剧”
AI在线从昆仑万维获悉,全球首个集成视频大模型与 3D 大模型的 AI 短剧平台 SkyReels 今天正式发布。据官方介绍,SkyReels 平台集剧本生成、角色定制、分镜、剧情、对白 / BGM 及影片合成于一体,创作者能够“一键成剧”,用户输入一个简单创意,该工具即可完成从剧本到成品短剧制作的全流程。官方分享了一段 AI 短剧 DEMO 如下:一天,敏感内向的男孩小杰独自走在街头,却意外偶遇了一只不属于地球的灵动小生物 —— 它那一身亮橙色皮毛在阳光下闪闪发亮。小生物跟小杰在相处中成了朋友,他们在草坪上打盹、
预测蛋白质-DNA结合特异性,南加州大学团队开发几何深度学习新方法
编辑 | 萝卜皮预测蛋白质-DNA 结合特异性是一项具有挑战性但又至关重要的任务,有助于理解基因调控。蛋白质-DNA 复合物通常与选定的 DNA 靶位结合,而蛋白质则以不同程度的结合特异性与广泛的 DNA 序列结合。这些信息无法在单一结构中直接获取。为了获取这些信息,南加州大学(University of Southern California)和华盛顿大学(University of Washington)的研究人员提出了深度结合特异性预测器(DeepPBS),这是一种几何深度学习模型,旨在根据蛋白质-DNA 结