应用 - AI在线

人形机器人：视频里性感，现实中孤独

机器之能报道编辑：Sia“我们的一些竞争对手曾公开声明，他们使用五根手指的手基本上是为了进行品牌推广。”昨天 Figure 01 又让无数人惊掉下巴。这次不是融资金额，而是一边归置餐具一边唠嗑的能力。形成鲜明对比的是，在北美最大的制造业和供应链贸易盛会 MODEX 上，人形机器人少得可怜。除了 Digit，还有一个给人取零食的人形机器人，不过是靠远程操控。Reflex Robotics 的人形机器人能从不同高度的货架上拿取物品，底部是轮子，不是自主运行，而是远程操控。对手上热搜，一支由八台 Digit 组成的工作小

智谱AI狂飙：与商业化博弈的一年

2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时，张帆如是说。张帆在 2023 年 3 月加入中国大模型领域“当红炸子鸡”智谱负责商业化，他感慨：“大模型不仅把知识给压缩了，还把时间给压缩了。 ”最直接的体现是，在过去的 9 个月，张帆以每个月见大约 100 家客户的速度在推进智谱的大模型商业化，2023 年结束时，张帆团队已拜访了上千家客户。

苹果大模型MM1杀入场：300亿参数、多模态、MoE架构，超半数作者是华人

苹果也在搞自己的大型多模态基础模型，未来会不会基于该模型推出相应的文生图产品呢？我们拭目以待。今年以来，苹果显然已经加大了对生成式人工智能（GenAI）的重视和投入。此前在 2024 苹果股东大会上，苹果 CEO 蒂姆・库克表示，今年将在 GenAI 领域实现重大进展。此外，苹果宣布放弃 10 年之久的造车项目之后，一部分造车团队成员也开始转向 GenAI。如此种种，苹果向外界传达了加注 GenAI 的决心。目前多模态领域的 GenAI 技术和产品非常火爆，尤以 OpenAI 的 Sora 为代表，苹果当然也想要在

Sora竟是用这些数据训练的？OpenAI CTO坦白惹众怒

采访首次揭示出 Sora「有所为（比如，将生成效果逼向极限）」和「有所为不为（比如短期内不开放、不生成公众人物）」背后的深层考量——找到一条将 AI 融入日常生活的正确道路是极其困难的，但也绝对值得一试。OpenAI 的 Sora 在今年 2 月横空出世，把文生视频带向了新阶段。它能够根据文字提示生成超现实场景。Sora 的可适用人群受限，但是在各媒体平台上，Sora 的身影无处不在，大家都在期待着使用它。在前几天的访谈中，三位作者透露出 Sora 的更多细节，包括它处理手部时仍然存在困难，但正在优化。他们也对 S

18个月，开创AI药研先例，Insilico公开其首款AI药物研发全过程，登Nature子刊

编辑 | 凯霞去年 6 月，Insilico Medicine 宣布全球首款 AI 设计的药物 INS018_055 进入 II 期临床试验，首批患者给药。近日，Insilico 在《Nature Biotechnology》发表题为《A small-molecule TNIK inhibitor targets fibrosis in preclinical and clinical models》的文章，重点介绍了其声称的第一个 AI 生成和发现的药物 INS018_055 的整个历程。Insilico 创始人

星舰首次进入太空轨道，里程碑式突破：人类离火星旅行又近一步

它会带我们飞向外星吗？成功入轨，星舰 Starship 这次向前迈进了一大步。美国东部时间 3 月 14 日早上 9 点 25 分，随着人们整齐一致的倒数声，星舰在得克萨斯州南部博卡奇卡海滩附近的 Starbase 基地顺利升空。今天的发射准备工作较为顺利。在短暂推迟后，33 台猛禽发动机均成功点火并顺利升空。火箭在 52 秒达到最大动压点（Max Q），这是一个航空术语，指飞行器在飞行过程中经历最大动态压力的位置。2 分 42 秒后，一二级火箭成功完成了热分离。星舰飞船 SN28 启动 6 台猛禽发动机把自己推离

技术大揭秘！荣耀曝光首款AI PC，MagicBook Pro 16现场谍照抢先看

笔记本未来已来？生成式人工智能在个人电脑（PC）领域的应用成为新一轮角力之处，当前芯片厂商和 PC 品牌商都十分看好 AI PC 市场。相较于普通的 PC，AI PC 通过在电脑端运行经过压缩和优化的大模型，让用户体验到更多生成式 AI 应用，比如文生图、智能创作。2024 开年伊始，芯片和 PC 厂商便开始在 AI PC 领域发力。在 1 月 CES2024 博览会上，英伟达、AMD、英特尔和高通均秀起了各自在集成 AI 技术方面的最新进展。而对于 PC 厂商而言，要抓住这波生成式 AI 发展机遇，通过性能强大、

讲座预约 | 四位专家大论道：AI+手语识别，技术革新与应用前景｜GAIR live

在这个充满创新的时代，技术正以前所未有的速度改变我们的生活。然而，对于那些生活在无声世界中的听障和聋哑人士来说，沟通的障碍依然存在。幸运的是，手语识别技术的出现，为打破这一障碍带来了希望。

海尔联合乐聚展出人形机器人“夸父”：支持洗衣、浇花等操作，搭载开源鸿蒙

感谢3 月 14 日至 16 日，海尔机器人、乐聚机器人在 2024 年中国家电及消费电子博览会（简称：AWE）联合展出了国内首款面向家庭场景的人形机器人 ——Kuavo（夸父）。IT之家从官方获悉，Kuavo（夸父）作为国内首款可跳跃、可适应多地形行走的开源鸿蒙人形机器人，在 AWE 展会现场除了展示其跳跃、快走等控制性能，还展示了洗衣、浇花、插花、晾衣服等近期学习的手部操作成果。去年 12 月底，乐聚机器人与海尔家庭机器人达成了战略合作，计划推进人工智能及机器人在海尔智慧家庭场景中的应用及服务机器人产业发展。官

李开复旗下 AI 模型“零一万物 API”上线，支持文档理解、图片问答等

感谢李开复旗下零一万物日前上线官方 API ，用户可以体验 Yi 系列 AI 大模型，其中包含 yi-34b-chat-0205、yi-34b-chat-200k、yi-vl-plus。IT之家汇总如下：yi-34b-chat-0205：基于开源版进行深度优化的版本，指令遵循能力提升近 30%，模型回复延迟大大降低。适用于聊天、问答、对话、协作、翻译等场景。yi-34b-chat-200k：200K 超长上下文，支持处理约 20w ~ 30w 个中文汉字（约为 1 本《哈利波特》）或英文单词。适用于多篇文档内容理解

3 个实用小技巧，帮你更好地使用 Midjourney 新功能 Character Reference ！

大家好，这里是和你们一起探索 AI 绘画的花生~ 继推出 Style Reference 风格一致性功能后，Midjourney 终于在前几天上线了备受大家期待的新功能 Character Reference （角色参考），用于保持角色形象的一致性。前面已经有文章详细讲解了 Character Reference 的具体用法，今天我再推荐 3 个实用小技巧，帮助大家更好地使用这项新功能。相关推荐回顾：一、提升人物面部相似度 Character Reference 可以让我们在生成不同图像时，保持其中角色形象的一致

因聚而生，数智有为：华为举办中国合作伙伴大会2024

今天上午，华为中国合作伙伴大会 2024 在深圳开幕。大会以 “因聚而生，数智有为” 为主题，面向数智化转型的浪潮，华为携手伙伴共同探讨如何通过强化 “伙伴华为” 体系，帮助客户抓住数智化转型的巨大机遇，加速迈向智能世界。我们正处于数字经济迅猛发展的前沿，数字化、智能化、低碳化已经成为经济和社会发展的关键驱动力，为千行万业的数智化转型带来了前所未有的商业机会和经济价值，而可持续化也正给中国政企市场的发展带来巨大的机遇。在这个大趋势下，各行业和企业数智化转型升级需求正在不断涌现。华为常务董事、ICT 基础设施业

AI4Science与LLM的碰撞：生物分子+文本的联合建模，人大高瓴、微软、华科、中科大团队最新综述

作者 | 裴启智随着大模型和 AI4Science 的蓬勃发展，越来越多的工作开始关注生物分子（Biomolecule）与自然语言（Language）的联合建模。这种方法利用文本数据中所包含的生物分子的丰富、多方面的描述，增强模型对其的理解，提高生物分子属性预测等下游任务的效果，为全面表示和分析生物分子开辟了新的途径。近日，人大高瓴联合微软、华科、中科大等机构发布了综述文章：《Leveraging Biomolecule and Natural Language through Multi-Modal Learni

可训练24万亿参数的大模型，Cerebras 推出其下一代晶圆级 AI 芯片

图：Cerebras 第三代晶圆级 AI 巨型芯片 WSE-3。（来源：Cerebras）编辑 | 白菜叶人工智能超级计算机公司 Cerebras 表示，其下一代晶圆级人工智能芯片可以在消耗相同电量的情况下将性能提高一倍。Wafer Scale Engine 3 (WSE-3，文中又称 CS-3) 包含 4 万亿个晶体管，由于使用了更新的芯片制造技术，比上一代增加了 50% 以上。该公司表示将在新一代人工智能计算机中使用 WSE-3，这些计算机目前正在 Dallas 的一个数据中心组装，这将是一台能够执行 8 ex

上海AI实验室开源发布高质量语料“万卷CC”

近日，上海人工智能实验室（上海AI实验室）发布新一代高质量大模型预训练语料“万卷CC”（WanJuan-CC），首批开源的语料覆盖过去十年互联网上的公开内容，包含1千亿字符（100B token），约400GB的高质量英文数据。作为“大模型语料数据联盟”今年首发的开源语料，WanJuan-CC将为学界和业界提供大规模、高质量的数据支撑，助力构建更智能可靠的AI大模型。预训练数据的质量对大模型整体性能至关重要。

零一万物API正式上线：支持输入30万汉字，看不懂《百年孤独》的人有救了

2024 年，大模型领域的一个趋势越来越清晰：重视优化，面向应用。在去年的百模大战中，科技巨头、创业力量你追我赶，将大模型技术卷到了一个新的高度。有了强大的模型之后，更重要的是将这些能力输出到现实中的应用场景，提升用户体验、构建生态。正因此，大模型厂商们或是开源，或是推出模型 API，都是希望让成果为开发者所用，以此为基础设施构建起繁荣的大模型生态。国内的大模型独角兽公司零一万物，也在今天正式发布了 Yi 大模型 API 开放平台。零一万物 API 开放平台链接： API 开放平台提供以下模型：Yi-34B-Cha

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

在 AI 智能体这个领域，谷歌 DeepMind 又有了一项里程碑式研究。视频游戏是 AI 系统的重要试验场。与现实世界一样，游戏也是丰富的学习环境，具有反应灵敏的实时设置和不断变化的目标。从早期与雅达利游戏的合作，到人类大师级水平的《星际争霸 II》系统 AlphaStar，谷歌 DeepMind 在人工智能和游戏领域陆续推出过不少影响力研究。刚刚，谷歌宣布了又一项里程碑式研究：SIMA（Scalable Instructable Multiworld Agent），一种适用于 3D 虚拟环境的通用 AI 智能体

4万亿个晶体管，单机可训练比GPT4大10倍的模型，最快最大的芯片面世

刚刚，芯片创业公司 Cerebras 宣布了该公司历史上最重要的消息，「我们发布了世界上最快的芯片，该芯片拥有高达 4 万亿个晶体管。」一直以来，Cerebras 一直在往「大」的芯片方面发展，此前他们发布的晶圆级引擎（Wafer Scale Engine，WSE-1）面积比 iPad 还大。第二代 WSE-2 虽然在面积上没有变化，但却拥有惊人的 2.6 万亿个晶体管以及 85 万个 AI 优化的内核。而现在推出的 WSE-3 包含 4 万亿个晶体管，在相同的功耗和价格下，WSE-3 的性能是之前记录保持者 WS

应用