动作

即梦AI推全新“动作模仿” 功能：人物图片+参考视频生成同款动作视频

即梦 AI 发布了一项全新的 “动作模仿” 功能，旨在为用户提供更加生动和真实的 AI 视频创作体验。这项功能由字节跳动的智能创作数字人团队提供技术支持，允许用户只需通过即梦 AI 的数字人入口，上传一张人物图片和一条参考视频，即可生成动态视频，让图片中的人物能够模仿参考视频中的动作，并准确还原情绪。根据即梦 AI 的官方介绍，该 “动作模仿” 功能支持肖像、半身及全身等多种画幅类型，能够同步还原不同画幅下的肢体动作和人脸表情。

3/5/2025 9:12:00 PM

AI在线

即梦 AI 上线 “动作模仿” 功能：一键让图片人物动起来

3月5日，即梦 AI 上线 “动作模仿” 功能，用户从“数字人”入口进入，只需上传一张人物图片和一条参考视频，就能生成一条动态视频，让图片里的人物模拟参考视频中的人物动作，连情绪都能一比一还原。该功能支持包括肖像、半身以及全身在内的不同画幅，为用户提供更广阔的创作空间，更好地满足其创作需求。图说：即梦“动作模仿”功能入口和玩法示意据介绍，即梦AI“动作模仿”功能由字节跳动智能创作数字人团队提供技术支持。

3/5/2025 3:41:00 PM

新闻助手

苹果把台灯做成机器人！能用动作表达情绪，重新定义机器人交互

苹果首款机器人（试验版），居然是个台灯？？前段时间苹果布局机器人的消息频频传出，但究竟要做个什么样式儿的一直没有定论。

2/8/2025 12:45:08 PM

GPT-4o 能玩《黑神话：悟空》：精英怪胜率超人类，无强化学习纯大模型方案

AI 玩黑神话，第一个精英怪牯护院轻松拿捏啊。有方向感，视角也没有问题。躲闪劈棍很丝滑。甚至在打鸦香客和牯护院时，AI 的胜率已经超过人类。而且是完全使用大模型玩，没有使用强化学习。阿里巴巴的研究人员们提出了一个新型 VARP（视觉动作角色扮演）智能体框架。它能直接将游戏截图作为输入，通过视觉语言模型推理，最终生成 Python 代码形式的动作，以此来操作游戏。以玩《黑神话・悟空》为例，该智能体在 90% 简单和中等水平战斗场景中取胜。GPT-4o、Claude 3.5 都来迎战研究人员以《黑神话・悟空》为研究平台

9/22/2024 3:06:25 PM

汪淼

元象推出国内首个基于物理的3D动作生成模型MotionGen

www.MotionGen.cn 一句话生成复杂3D动作，效果惊艳！测试期可申请免费试用。3D内容制作领域，生成逼真的角色动作生成是一个持续挑战，传统方法依赖大量的手K制作，或昂贵动作捕捉设备，效率低、成本高、难以生成一般运动任务或适应复杂场景和交互。元象XVERSE推出国内首个基于物理的3D动作生成模型MotionGen，创新性融合大模型、物理仿真和强化学习等前沿算法，让用户输入简单文本指令，就能快速生成逼真、流畅、复杂的3D动作，效果惊艳，标志着中国3D AIGC领域的重大突破。现在起，零经验创作者也能轻松上手

8/28/2024 3:41:00 PM

新闻助手

“HumanPlus”机器人问世：可模仿人类动作弹钢琴、叠衣服，基于中国公司平台

斯坦福大学研究人员近日研发了一款仿人机器人 HumanPlus，它可以模仿人类的行为，并支持模仿动作来进行学习。据介绍，它可以通过模仿人类动作来学习弹钢琴、回击乒乓球、折叠衣服等。斯坦福大学团队成员傅子鹏（音译）表示，该类人机器人使用单个 RGB 摄像头和全身策略来复制人类动作。值得一提的是，傅子鹏 14 日在其个人 YouTube 频道上发布了 HumanPlus 的数个演示视频，展示了其诸多方面的“学习能力”。研究人员表示，HumanPlus 需要约 40 小时的人类运动数据来学习一项任务，然后逐步执行。此

6/20/2024 9:32:37 AM

清源

ASQuery：基于Query的时序动作分割新架构

1. 前言北京邮电大学与EVOL创新团队和ACG工业算法组针对时序动作分割任务共同提出了基于query新架构的模型ASQuery。ASQuery包含了动作及边界两种query，利用动作query将原先的帧维度分类过程转化为query与视频帧的相似度计算过程，提高了分类精度；利用边界query预测动作的边界，进一步平滑了原先的预测结果，大大缓解了过分割现象。论文ASQuery: A Query-based Model for Action Segmentation 已被ICME2024接收。论文地址：。2. 背景和动

6/3/2024 2:44:00 PM

新闻助手

解密机器人大模型RFM-1：Covariant创始人陈曦专访

作者：王建明来源：微信公众号「石麻笔记」2024年3月，在通用机器人的发展史上，绝对是值得纪念的一个月。3月11日，知名AI机器人创业公司Covariant推出了首个机器人基础模型RFM-1（Robot Foundation Model-1），这是世界上首个基于真实任务数据训练的机器人大模型，也是最接近于解决真实世界任务的机器人大模型；次日，Covariant创始人Pieter Abbeel的徒弟和徒孙Sergey Levine和Chelsea Finn宣布创办Pi（Physical Intelligence），一

3/26/2024 3:42:00 PM

新闻助手

FG2024Workshop |花样滑冰人体动作识别挑战赛与研讨会启动！

作为计算机视觉的国际重要会议之一，CCF C类国际会议FG 2024 (International Conference on Automatic Face and Gesture Recognition)将于2024年5月28-31日举办。花样滑冰人体动作识别挑战赛将作为花样滑冰人体动作识别研讨会的一部分与FG2024一起举办。背景计算机视觉中的人体行为理解主要关注于在视频中定位、分类和评估人类行为。然而，目前的任务对于细粒度动作分割和评估等实际应用来说是不足够的。为了解决这个问题，我们构建了一个数据集Skati

3/21/2024 2:14:00 PM

新闻助手

ICCV 2023 | 重塑人体动作生成，融合扩散模型与检索策略的新范式ReMoDiffuse来了

来自南洋理工大学和商汤科技的研究者联合提出了一种全新的文本驱动动作生成框架——ReMoDiffuse。

9/27/2023 2:54:00 PM

MMLab

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练