AI资讯列表 - AI在线

ChatGPT 也在评审你的顶会投稿，斯坦福新研究捅了马蜂窝

尴了个大尬！人们还在嘲讽有人用 ChatGPT 写论文忘了删掉“狐狸尾巴”，另一边审稿人也被曝出用 ChatGPT 写同行评论了。而且，还是来自 ICLR、NeurIPS 等顶会的那种。来自斯坦福的学者对一些顶级 AI 会议（如 ICLR、NeurIPS、CoRL 等）中的审稿意见进行了分析，结果发现 ——在 ChatGPT 出现之后，这些同行评论的“AI 含量”大增，最多的高达 16.9%，而有 ChatGPT 之前这个比例大约是 2%。证据也很直观，AI 常用的词汇出现频率，在 ChatGPT 发布之后噌的一下

清华创业团队帮你造梦，Idea秒变微电影，最长可达数十分钟！

机器之能报道编辑：Cardinal开创性地将多模型智能体协作技术引入视频领域，只需要输入一句话，Dream Factory 就会自动生成完整的剧本和视频。它是剧本作者，亦是视频导演。AI 生成视频场景、情节单一是当下大模型的通病随着大模型的飞速发展，文字生成视频领域迅速火爆。然而，目前的文字生成视频通常是一句话生成单场景、单情节的视频，即使是头部视频大模型发布的东京佳人、雪地幼犬等视频 Demo，亦逃不开单场景、单情节的限制。在实际应用过程中，用户更需要的是多场景、多情节、有故事性的视频，将文字生成多场景、多情节

2个月不见，人形机器人Walker S会叠衣服了

机器之能报道编辑：吴昕国内版的人形机器人大模型组队，首次完成叠衣服这类复杂柔性材料的操作任务。随着融合了 OpenAI 多模态大模型的 Figure 01 揭开神秘面纱, 国内同行的相关进展一直备受关注。就在昨天，国内“人形机器人第一股”优必选发布了人形机器人 Walker S 深入融合百度文心大模型后的首个 Demo，展示了一些有趣的新功能。视频链接：，得到百度文心大模型能力加持的 Walker S 是这个样子的。视频链接： Figure 01 一样，Walker S 没有走动，而是站在桌子后面完成一系列任务。

少量数据实现高通用性，KAIST开发药物设计3D分子生成新框架

编辑 | 萝卜皮深度生成模型具有加速药物设计的巨大潜力。然而，由于数据有限，现有的生成模型常常面临泛化方面的挑战，导致设计创新性较差。为了解决这些问题，韩国 KAIST 的研究人员提出了一种相互作用感知的 3D 分子生成框架，该框架能够在靶标结合口袋内进行相互作用引导的药物设计。通过利用蛋白质-配体相互作用的通用模式作为先验知识，该模型可以利用有限的实验数据实现高度的通用性。通过分析生成的未见靶标配体的结合姿势稳定性、亲和力、多样性和新颖性等，对其性能进行了全面评估。此外，潜在突变选择性抑制剂的有效设计证明了该方法

全球首个涉 AI 安全双边协议，英美两国建立人工智能安全科学合作伙伴关系

感谢美国东部时间 4 月 1 日晚，美国和英国签署了一项具有里程碑意义的 AI 相关协议，双方宣布建立人工智能安全科学合作伙伴关系。这也是全球首个关于人工智能安全的双边协议。该协议明确，英国去年 11 月成立的新 AI 安全研究所和美国同类机构，将通过借调两国研究人员来互相交流专业知识。图源 Pixabay此外，两家机构还将开发一种共同的人工智能安全测试方法，包括使用相同的方法和底层基础设施，双方将根据国家法律法规和合同，寻求员工交流和信息共享。新闻稿还称，双方拟将在一个“可公开访问”的 AI 模型上开展联合测试。

号称“音乐 ChatGPT 时刻”来临，天工 SkyMusic 音乐生成大模型今日邀测

昆仑万维集团今日宣布，其音乐生成大模型“天工 SkyMusic”即日起开启免费邀测。本轮邀测将开放 1000 个免费名额，面向行业媒体、专家、以及感兴趣的音乐从业者开放，正式版将在 4 月 17 日随「天工 3.0」面向全社会免费开放。“天工 SkyMusic”号称目前国内唯一公开可用 AI 生成大模型，天工 SkyMusic 采用音乐音频领域类 Sora 模型架构，Large-scale Transformer 负责谱曲，来学习 Music Patches 的上下文依赖关系，同时完成音乐可控性；Diffusion

支付宝面向全国医院、医疗机构开放“AI 就医助理”解决方案

支付宝今日发布“AI 就医助理”解决方案，利用 AI 大模型、数字人等技术，助力医疗机构为患者提供覆盖就医前、中、后的“AI 陪伴就诊”服务，并宣布这一解决方案将正式面向全国医院、医疗机构开放。据介绍，各医疗机构应用了该套解决方案后，患者可以获得更好的就医体验，IT之家附介绍如下：1、【就诊前】线上描述自己的症状，匹配对应科室，不怕挂错号；2、【到达医院后】由城市、医院定制的“助理”为患者进行就医规划，提供带路、查报告、医保支付等服务；3、【就诊后】除了电子病历、处方和报告查询，健康助理还会为患者建立一份院内外通用

AI医疗应用又有新进展，支付宝开放“AI就医助理”解决方案

AI在医疗场景的应用又有新进展。 4月2日，支付宝发布“AI就医助理”解决方案，利用AI大模型、数字人等技术，助力医疗机构为患者提供覆盖就医前、中、后的“AI陪伴就诊”服务。据支付宝介绍，“AI就医助理”解决方案为用户提供从诊前、诊中到诊后的全过程智能交互。

破局 AI 数据中心用电荒，美国政府正探索兴建核电站

美国能源部长詹妮弗・格兰霍姆（Jennifer Granholm）近日接受 Axios 采访时，表示正积极探索核电站解决方案，以缓解 AI 数据中心的用电需求。格兰霍姆表示美国发展 AI 本身并不是问题，AI 可以帮助人类解决很多问题。但问题的关键在于 AI 的快速发展已经超出国家电网的承载能力，现有电网无法支撑 AI 数据中心的快速扩张。IT之家从报道中获悉，美国能源部（DOE）一直在与微软、谷歌和亚马逊等超大规模企业商谈，开始考虑建立核聚变和核裂变发电厂，以满足扩张 AI 的需要。格兰霍姆表示已经和微软进行了深

叠衣服、擦案板、冲果汁，能做家务的国产机器人终于要来了

将家务全部交给机器人的那一天，或许会比想象中更快到来。还记得会炒菜的斯坦福 ALOHA 机器人吗？现在，中国的初创公司自变量机器人（X Square）展示了同样令人惊艳的能力，甚至更进一步。在该公司最新展示的 Demo 中，完全基于大模型自主推理的双臂机器人，利用低成本硬件即实现对不规则物体的精细操作（如抓握、拾取、切割等），以及折叠衣服、冲泡饮料等复杂任务，展现出相当程度的泛化性能。折叠衣物（3 倍速播放）：对柔性物体的操作长久以来都是困扰整个 manipulation 领域的难题，需要高度灵活的操作和精细的动作

音乐ChatGPT时刻来临！「天工SkyMusic」音乐大模型今日启动邀测

4 月 2 日，昆仑万维 AI 音乐生成大模型「天工 SkyMusic」即日起面向社会开启免费邀测。本轮邀测将开放 1000 个免费名额，面向行业媒体、专家、以及感兴趣的音乐从业者开放，用户可扫描文后二维码或通过网页填写申请，收到申请表后工作人员将第一时间联络回复。「天工 SkyMusic」正式版也将在 4 月 17 日随「天工 3.0」面向全社会免费开放。申请网页：「天工 SkyMusic」基于昆仑万维「天工 3.0」超级大模型打造，是目前国内唯一公开可用的 AI 音乐生成大模型。在通往 AGI 的道路上，多数团

现在，ChatGPT不注册登录也能免费用了

算力只是个小问题？现在，使用 OpenAI 的人工智能平台 ChatGPT，不需要注册账户了。当地时间 4 月 1 日，OpenAI 正式公布了这个新政策，立即引来了全网的欢呼。在开放之后，ChatGPT 打开就能用，看起来终于初步具备了「AI 搜索引擎」的样子。不过这次开放仅适用于免费版的 ChatGPT（3.5 版本），其他 OpenAI 产品如 DALL-E 3、GPT-4 等仍然需要付费才能访问，当然也需要登录帐户。人们第一时间涌入 ChatGPT 的网站尝试，很多国家和地区的用户表示仍需登录。也有人表示第

苹果AI放大招？新设备端模型超过GPT-4，有望拯救Siri

或许不久之后，Siri就能看懂手机屏幕并帮你点外卖了。在最近的一篇论文中，苹果的研究人员宣称，他们提出了一个可以在设备端运行的模型，这个模型在某些方面可以超过 GPT-4。具体来说，他们研究的是 NLP 中的指代消解（Reference Resolution）问题，即让 AI 识别文本中提到的各种实体（如人名、地点、组织等）之间的指代关系的过程。简而言之，它涉及到确定一个词或短语所指的具体对象。这个过程对于理解句子的意思至关重要，因为人们在交流时经常使用代词或其他指示词（如「他」、「那里」）来指代之前提到的名词或名

发展新质生产力，金融行业如何释放AI「模」力？

作为新一轮科技革命和产业变革的重要驱动力量，以大模型为代表的人工智能正与实体经济深度融合，加速推动新质生产力的形成。「人工智能」落地，离不开充满韧性和活力的产业生态，上海积极布局推动大模型垂直化、产业化落地。2023 年 11 月，上海市发布了《上海市推动人工智能大模型创新发展若干措施（2023-2025 年）》，提出「实施大模型示范应用推进计划」，重点支持在生物医药、集成电路、科技金融、自动驾驶、机器人等领域构建示范应用场景，打造标杆性大模型产品和服务。同时，鼓励浦东新区等建立大模型生态集聚区，聚焦大模型研发

提车最长等待时间近 8 个月，消息称小米汽车 SU7 锁单达 4 万辆

感谢据第一财经报道，截至 4 月 2 日凌晨，小米 SU7 的锁单量已达到 4 万辆。此外，该车的交付周期出现了进一步地延长。3 月 31 日，小米 SU7 标准版锁定订单后交付周期预计为 16~19 周，Pro 版预计 17~20 周交付，Max 版则需 26~29 周交付。至 4 月 2 日上午，上述交付周期已经分别延长至 20~23 周、19~22 周以及 28~31 周。知情人士透露，小米汽车原本的 4 月生产计划约为 5000 辆，目前小米汽车已经在和供应商协商，提高生产能力，但预估产能爬坡会有一个过程。

阿里云全面推行 AI 写代码，未来 20% 代码由通义灵码编写

阿里云正在内部全面推行 AI 编程，使用通义灵码辅助程序员写代码、读代码、查 BUG、优化代码等。阿里云还专门给通义灵码分配了一个正式的员工工号 ——AI001。据阿里云相关人士透露：“公司未来 20% 的代码将由通义灵码编写，但程序员仍然是研发的核心，他们将有更多时间专注于系统设计以及核心业务开发工作。”据介绍，传统开发模式下，程序员每天需要耗费大量精力编写重复性代码、调试优化、编写代码注释等基础工作，大幅挤压了核心业务代码编写的时间。在阿里云内部，通义灵码已在各个开发环节担任代码助理角色。以 API 开发测试工

征稿｜ CVPR 2024 Workshop ｜第一届 Virtual Humans for Robotics and Autonomous Driving

探索虚拟人（数字人）赋能机器人与自动驾驶领域的前沿问题在人类居住的世界中，人类是最为核心的元素。因此，智能机器（例如，自动驾驶车辆和机器人）必须在人口密集的环境中具备社会意识, 与人交互。而如何感知和理解人类在智能机器研究中至关重要。然而，由于现实世界中的人类行为多样性，其对环境变化的影响，再加上智能体与人类互动时的安全考虑，种种因素使得在真实环境中训练具备社会意识的智能体变得极为困难。近年来，仿真环境作为训练智能体的一种有效的方式应运而生。但是，这些仿真环境就像无人居住的幽灵城市一样，并未包括对人类的有效模拟。如

元象首个MoE大模型开源：4.2B激活参数，效果堪比13B模型

元象发布XVERSE-MoE-A4.2B大模型，采用业界最前沿的混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，让海量中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。GPT3、Llama与XVERSE等主流大模型发展遵循规模理论（Scaling Law），在模型训练和推理的过程中，单次前向、反向计算时，所有参数都被激活，这被称为稠密激活（densely activated）。当模型规模增大时，