一:研究背景
具备自然类人行走能力的人形机器人,是实现人机共存的重要基础。随着人形机器人逐渐从受控实验室环境走向家庭、工作场所和公共空间,其步态质量不仅直接影响运动效率,还影响公众的接受程度。不自然的机械步态可能显得生硬、不适,并加速关键部件的磨损;相反,流畅且具有生物仿真特性的步态不仅能够提高机器人运行效率,还可作为理想平台,用于测试外骨骼等康复辅助设备,从而减少对人体实验的依赖。然而,由于机械结构设计与控制系统之间的复杂耦合,实现自然类人运动仍然是一项根本性挑战。
近年来,强化学习(Reinforcement Learning, RL)和模仿学习(Imitation Learning, IL)显著推动了人形机器人运动能力的发展。例如,基于强化学习的控制方法已经实现了从仿真到现实的人形机器人稳定行走,并能够在复杂地形和规划步态条件下实现自适应运动 [2]。模仿学习方法通过利用人体运动数据,使机器人能够生成更加接近人类的运动模式,例如 PHUMA 数据集进一步促进了类人运动策略的学习 [3]。然而,这些方法通常仅通过模仿人体关节角度实现运动,而缺乏生物力学约束,导致机器人虽然在视觉上接近人类,但其内部运动机制仍可能存在显著差异。此外,由于缺乏统一的定量评价标准,机器人步态优化过程仍高度依赖经验驱动的奖励函数设计,缺乏系统性和可解释性 [4]。已有部分研究尝试比较机器人与人类步态 [5], [6]。然而,这些研究在有限或不一致的行走速度条件下进行,而行走速度是影响步态运动学和动力学特性的关键因素之一。在不同速度条件下,人类步态会表现出显著变化,包括关节运动模式、能量分布以及推进机制等。因此,在不一致速度条件下进行人机对比,将限制分析结果的系统性和科学性。
为解决上述问题,本文提出步态差异分析框架(Gait Divergence Analysis Framework, GDAF),这是一个系统化的生物力学分析框架,用于定量分析人类与人形机器人步态之间的差异。本文基于该框架首次建立了覆盖 28 种连续行走速度(0.5–1.85 m/s)的人机步态对比基准,并提供公开的数据集、分析工具和可视化系统。据我们所知,这是首次基于连续速度变化,对强化学习与模仿学习控制的人形机器人与人类步态进行系统化生物力学对比。通过引入精细速度分辨率,本研究不仅捕捉了不同速度下的步态特征,还揭示了步态运动学与动力学随速度变化的演化规律,为人形机器人控制策略优化提供了科学依据。
二: 研究方法
2.1 数据采集与处理
为实现科学、可重复的人机步态对比,研究团队分别采集了人类与 Unitree G1 人形机器人在自带的走跑运控模式下 28 种连续行走速度(0.5–1.85 m/s)的步态数据。人类数据来源于公开生物力学数据库 [7],通过运动捕捉和地面反作用力测量,计算得到关节角度、关节力矩和关节功率等关键动力学指标;机器人数据则直接记录机器人以不同速度行走时各关节的角度、角速度与电机输出力矩。所有数据均提取完整步态周期,统一归一化为 0%–100% 的标准步态周期,并在相同速度下对多个周期进行平均。关节功率通过角速度和扭矩计算得出,然后将关节力矩和功率用机器人体重进行归一化。此外,如图1所示,研究团队建立了人体关节与机器人执行器之间的生物力学对应关系,该映射是根据解剖功能和运动平面确定的。由于人类和机器人使用不同的坐标系,我们在分析之前将人体运动数据转换为机器人的坐标系,以确保比较的一致性。
(人形机器人与人类的关节映射示意图)
2.2 步态差异分析框架(GDAF)
本研究的核心是提出并应用GDAF,它系统地量化了不同步行速度下人类和类人机器人步态模式之间的异同。基于上述统一的预处理管道,GDAF在归一化的步态周期和统一的关节坐标系上运行,包括三个阶段:(i) 数据准备与可视化,(ii) 多维度定量差异分析,以及(iii) 综合GDAF指标。GDAF中使用的指标受到既定步态生物力学分析方法的启发并进行了改编。
2.2.1 数据准备与可视化
本节建立了一个标准化的数据准备模式,以提高分析代码的通用性和可重用性。通过确保所有后续代码模块都在这种统一格式上运行,本研究的计算框架可以轻松地适应并迁移到其他数据源,例如在不同速度条件下从不同机器人收集的数据集,或从模拟环境中获取的数据。
具体而言,所有处理后的生物力学数据都导出为统一的 .mat 模式。每个数据集存储为一组通道-速度矩阵和元数据:pos[通道, 速度] 以度为单位包含关节角度轨迹;torque[通道, 速度] 和 power[通道, 速度] 分别存储体重归一化的关节力矩(Nm/kg)和功率(W/kg);channel_label 列出了解剖关节名称;unique_speeds 记录以 m/s 为单位的步行速度。在每个单元格中,时间序列被重采样为从0%到100%的归一化步态周期,并在多个步幅上进行平均,以便任何下游分析都可以纯粹在步态百分比域中运行,而无需访问原始运动捕捉或电机数据。基于这种标准化格式,我们提供了开源代码,用于重现本文中的图表和分析:GDAF_01_Data_Visualization.ipynb 用于数据可视化。————GDAF_02_Divergence_Analysis.ipynb 用于步态分析。此外我们还发布了如图2所示的一个基于MuJoCo的自定义可视化工具(mujoco_gait_player.py),用于方便的数据检查和灵活的步态比较。
(基于MuJoCo的步态可视化工具。一个29自由度的宇树G1模型由记录的人类或机器人关节轨迹驱动。右图显示了步态周期内的关节运动学和动力学轨迹,与模拟运动同步。)
2.2.2 多维定量差异分析
GDAF在波形相似性、双侧对称性和能量行为三个维度上对人类和机器人步态进行了定量比较。所有分析都是针对单个关节(或适用时针对每个双侧关节对)和单个步行速度进行的。
一、波形相似性指标
1、皮尔逊相关系数(用于角度、力矩、功率)
公式:
含义:衡量人和机器人在同一关节、同一速度下,步态周期内角度/力矩/功率波形的相似性。
2、综合波形相似性指数
公式:
含义:对所有关节的角度、力矩、功率相似性加权平均,反映整体波形一致性。
二、双侧对称性指标
3、对称性指数
公式:
含义:衡量左右关节在最大/最小角度上的差异,值越大表示越不对称。
4、双侧功对称性指标
公式:
含义:衡量左右关节在正功和负功上的差异,值越大表示功分布越不对称。
三、能量行为指标
5、正负功
公式:
含义:关节在步态周期内产生的正功和负功。
6、人–机器人功差异指数
公式:
含义:衡量人和机器人在同一关节上正负功的相对差异。
四、综合评估指标
7、机器人对称性综合指数
公式:
含义:综合运动学和动力学对称性,值越低表示机器人自身步态越对称。
8、人-机器人相似性综合指数
公式:
含义:衡量机器人步态与人类的整体相似性,值越低表示越像人。
9、GDAF 综合指数
公式:
含义:最终的综合步态质量指标,值越低表示机器人在该速度下的步态越对称、越像人。
三: 研究结果
研究结果以图表展示,具体研究结果表述见论文。

图3:28种速度下人类受试者和类人机器人之间的关节角度、力矩和功率。
图4:人类受试者和人形机器人在三种步行速度下的下肢关节角度、力矩和功率比较。
图5: 人类受试者和类人机器人在三种步行速度下的扭矩 - 角度环比较。
图6:28种步行速度下关节角度、力矩和功率的相似性热度图。

图7人和机器人双侧下肢对称指数(SI)。
图8:功率曲线的正/负功。
表1:各速度下综合GDAF指数,括号内为人类参考值。
四:关键发现
4.1 速度依赖的步态质量和低速瓶颈
一个关键结果是机器人步态随着速度增加而单调改善,这由综合得分下降反映出来(表1)。这种改善由不对称性降低和类人程度增加共同驱动。值得注意的是,最大差距出现在低速时,这表明慢走仍然是一个瓶颈阶段,控制器在该阶段难以维持一致的双侧协调和平滑的能量调制。从控制角度来看,慢走通常需要以较小的动量进行精确的平衡调节,这意味着仅在中速或高速时评估类人机器人的运动可能会系统性地高估其整体生物力学逼真度。
4.2 人机一致性的近端到远端梯度
人机关节角度、力矩和功率的相似性热度图(图6)显示出明显的近端到远端梯度:髋部和膝部角度在大多数速度下具有高度一致性,而远端关节则表现出较低的相似性,特别是在动力学(力矩和功率)方面,这种梯度与定性扭矩 - 角度环(图5)一致。在人类中,脚踝蹬地利用肌腱弹性和被动能量存储 - 释放,自然产生平滑的准刚度模式。相比之下,刚性驱动的类人机器人必须通过控制和脚与地面的相互作用积极合成类似行为,这对时间和接触约束更为敏感。因此,远端关节的差异不仅应解释为控制限制,还应解释为驱动、足部设计和接触建模的综合结果。
4.3 机械功重分配和以膝盖为主导的策略
能量分析(图8)表明,与人类相比,机器人中正向功存在系统性重新分配:机器人产生的膝盖正向功大幅增加,而脚踝正向功减少,表明以膝盖为主导的推进策略且脚踝蹬地不足。这种模式与脚踝功率相似性降低和扭矩 - 角度环结构改变一致。这种重新分配可能是一种在不要求高脚踝峰值功率情况下满足稳定性和跟踪约束的应急解决方案。实际上,这些发现突出了改善类人机器人运动的两个互补方向:(i)硬件方面,例如脚部/脚踝柔顺性和弹性元件以实现被动能量交换;(ii)控制方面,例如明确的目标或约束,鼓励脚踝蹬地时机和关节间协调的功分配。
4.4 不对称性作为无明确约束的涌现属性
在所有报告的速度下,人类在运动学对称性指数和功对称性方面始终比机器人保持更好的对称性,最大差距出现在低速时。这表明,即使策略产生了视觉上合理的步态,轨迹极值和能量分布中仍可能存在细微的左右不一致。一个可能的解释是,强化学习/模仿学习优化可以收敛到任何满足任务奖励的稳定极限环,除非明确编码,否则对称性无法保证。GDAF为这种正则化提供了定量目标,例如在训练期间可以直接最小化远端关节SI和双边功对称性。
4.5 对基于证据的类人运动优化的启示
GDAF这支持了一个基于证据的优化循环,研究人员可以使用GDAF识别主要的失败模式(例如,低速功不对称、远端关节动力学不匹配等),然后完善奖励项、添加对称性约束、调整足部/脚踝设计或纳入柔顺性,并使用相同的速度连续基准重新评估。从这个意义上,GDAF可以通过提供可解释、可重复的指标来指导控制器开发和硬件迭代。
五:总结与展望
本研究提出了GDAF,这是一种用于定量比较人类和类人机器人步态生物力学的统一方法。通过引入标准化的处理管道和全面的差异度量,GDAF能够系统地评估多个步行速度下的关节运动学和动力学。我们进一步建立了一个可重复的速度连续基准,并提供了相应的分析工具。所提出的框架为评估和基准化类人机器人运动提供了定量基础。未来的工作将把GDAF扩展到其他运动任务,并将其指标整合到控制器优化中,以支持开发更自然更高效的机器人运动。
论文链接:https://arxiv.org/abs/2602.21666
Donghu Robot Laboratory, 2nd Floor, Baogu Innovation and Entrepreneurship Center,Wuhan City,Hubei Province,China
Tel:027-87522899,027-87522877