首次尝试!深度学习从原始视频中发现未知输入激励的动力系统的可解释物理定律

编辑/绿萝由于深度学习的发展进步,从视频中提取可解释的物理定律引发了计算机视觉社区的兴趣,但仍然面临巨大的挑战。控制方程(例如 PDE、ODE)的发现可能促进我们对复杂动力系统行为的理解、建模和预测。收集数据的日益丰富和机器学习的进步带来了动态系统建模的新视角。近日,来自中国人民大学和中国科学院大学、美国东北大学的研究团队提出了一个端到端的无监督深度学习框架,根据录制的视频揭示运动物体呈现的显式动力学控制方程。模拟动态场景的实验表明,所提出的方法能够提取封闭形式的控制方程并同时识别视频记录的多个动力系统的未知激励输

编辑/绿萝

由于深度学习的发展进步,从视频中提取可解释的物理定律引发了计算机视觉社区的兴趣,但仍然面临巨大的挑战。

控制方程(例如 PDE、ODE)的发现可能促进我们对复杂动力系统行为的理解、建模和预测。收集数据的日益丰富和机器学习的进步带来了动态系统建模的新视角。

近日,来自中国人民大学和中国科学院大学、美国东北大学的研究团队提出了一个端到端的无监督深度学习框架,根据录制的视频揭示运动物体呈现的显式动力学控制方程。

模拟动态场景的实验表明,所提出的方法能够提取封闭形式的控制方程并同时识别视频记录的多个动力系统的未知激励输入,这填补了文献中没有现有方法可用且适用于解决此类问题的空白。

该研究以「Distilling Governing Laws and Source Input for Dynamical Systems from Videos」为题,发布在预印平台 arXiv 上。

图片

控制方程的发现可能促进我们对复杂动力系统行为的理解、建模和预测。

对数据驱动的控制方程发现的研究,仍然主要集中在从给定的物理状态测量中建立数学模型。随着深度学习的进步,人们对从视频中发现物理规律的兴趣扩大了。

为了提高已发现物理定律的可解释性,学习显式动力学(例如,封闭形式的控制方程或其参数)最近在物理场景理解中变得越来越流行。然而,这些方法需要对物理定律或控制方程的结构有很强的先验知识。此外,对于那些方法,物理是在像素坐标中建模的,这限制了复杂动态系统(例如,ODE)的发现,其中物理状态需要在另一个物理坐标系中描述。

因此,直接从原始视频中发现控制方程仍然是一个巨大的挑战,尤其是在源输入未知的情况下。

图片

图 1:研究的由未知输入激发的动力系统。

在这项工作中,研究人员提出了一个端到端的无监督深度学习框架,以从视频中揭示受未知输入影响的动力系统的闭式控制方程。要解决的任务,如图 1 所示,展示了所构建的范式,旨在同时提取运动物体的物理状态,揭示其受控的封闭式方程,并识别系统输入。

图片

图 2:所提出的端到端无监督深度学习的架构示意图,以同时揭示封闭形式的控制方程并从视频中识别动力系统的输入(单个运动物体情况)。

与现有的深度学习方法通常从运动物体的空间/像素坐标轨迹中发现物理规律不同,研究人员所提方法从回归物理坐标系中的物理状态揭示了显式控制方程,这使得发现更复杂的动力系统成为可能。此外,物理状态的提取不是独立于编码器-解码器和物理坐标系回归,而是在底层物理定律的约束下进行的。联合优化不仅有助于物理状态的提取,而且导致了封闭形式的控制方程和未知输入的识别。

所研究动力系统的发现结果如图 3 所示,其中揭示了物理轨迹、它们的控制方程和外部激励。这表明控制方程,尤其是它们的系数与基本事实完全相同。而缩放后 TMTD 系统,还表明且该方法能够处理出现多个运动物体的情况在场景中。

图片

图 3:所研究动力系统的发现结果。

接下来,研究人员通过从有噪声的视频中发现控制方程来进一步测试所提方法对噪声的稳健性。如图 4 所示。结果表明,由于噪声的影响,与从没有噪声的视频中发现相比,识别出的系统输入噪声更大,但控制方程和物理轨迹仍然未被发现和正确提取。

目前,直接从视频中发现具有未知输入的动态系统的控制方程方面的文献仍然很少。研究人员将图 2 中所示的坐标一致编码器解码器替换为传统的卷积编码器-解码器,并将得到的方法作为另一个基线。发现该网络能够从视频中提取物理定律。由于提取的潜在变量不能正确地表示基于位置的物理状态,该方法未能揭示潜在的物理规律。此外,传统的自动编码器无法保证运动物体的物理状态和真实位置之间的固定关系。

图片

图 4:基线的发现结果。

研究人员提出了一种端到端的无监督深度学习方案,从记录运动物体的原始视频中揭示出明确的可解释物理定律,这些运动物体代表了由未知输入激发的动力系统。

该工作是首次尝试从具有未知输入激励的动态系统的原始视频中发现可解释的物理定律。但方法也存在一些局限性,例如,它不能处理非静止背景、带扭曲的视频和 3D 空间中的移动对象。研究人员将在正在进行和未来的研究中解决这些挑战。

论文链接:https://arxiv.org/abs/2205.01314

相关资讯

日本创企“人机一体”研发人形机器人,可自动保持身体平衡

据共同社报道,日本机器人创新企业“人机一体”和立命馆大学 1 日公开展示其最新开发的人形机器人。该机器人由人类进行远程控制,可在事先未掌握周围环境的情况下自动保持身体平衡并安全运作。据介绍,该公司力争在 5 年内在高处等危险场地投入使用。AI在线汇总该机器人主要信息如下:参数方面,该机器人高约 2 米、宽约 70 厘米、重约 90 公斤。操作方面,该机器人由人类使用操纵杆控制手脚动作,通过机体的摄像头判断外界环境。上半身的动作由人控制,下半身会自动保持平衡,以便在人类不便控制的、脚下较难行走的地方运作。机器人足底装

蜘蛛侠妖娆起舞,下一代 ControlNet 来了!贾佳亚团队推出,即插即用,还能控制视频生成

只用不到 10% 的训练参数,就能实现 ControlNet 一样的可控生成!而且 SDXL、SD1.5 等 Stable Diffusion 家族的常见模型都能适配,还是即插即用。同时还能搭配 SVD 控制视频生成,动作细节控制得精准到手指。在这些图像和视频的背后,就是港中文贾佳亚团队推出的开源图像 / 视频生成引导工具 ——ControlNeXt。从这个名字当中就能看出,研发团队给它的定位,就是下一代的 ControlNet。像大神何恺明与谢赛宁的经典大作 ResNeXt(ResNet 的一种扩展),起名字也是

类Sora模型到底懂不懂物理?字节完成系统性实验,图灵奖得主杨立昆赞转!

Sora爆火以来,“视频生成模型到底懂不懂物理规律”受到热议,但业界一直未有研究证实。 近日,字节跳动豆包大模型团队公布最新论文,研究历时8个月,围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,但暂时还无法真正理解物理规律,做到“举一反三”。 图灵奖得主、Meta首席AI科学家杨立昆点赞并转发了该研究,表示“结论不令人意外,但很高兴终于有人做了这个尝试!