在机器人复杂场景应用中,社交导航能力至关重要。社交导航指人机共存环境里,机器人依社会规范执行导航任务。如机器人导航至目标点,若目标处于行人未来轨迹交汇区,它既要规避碰撞风险,又要保持合适社交距离。
视觉导航领域中,预建地图难适应人群密集动态环境,现有RL方法存在短视决策和依赖全局信息问题。近期,香港科技大学(广州)与香港科技大学联合推出新算法Falcon,通过将轨迹预测算法融入社交导航任务,实现长期动态避障并提升导航性能。
社交导航另一挑战是现有基准真实性不足。现有基准存在场景复杂性不足、人类行为不自然等局限。为解决这些问题,研究团队构建两个新数据集Social-HM3D和Social-MP3D ,作为新基准。
Falcon算法框架由主策略网络(MPN)和时空预知模块(SPM)组成。主策略网络是Falcon的“大脑”,通过社会认知惩罚机制引导机器人规避碰撞、保持社交距离,设有障碍物碰撞惩罚、人类接近惩罚、轨迹阻碍惩罚项。时空预知模块结合轨迹预测与多种社交感知辅助任务,提升机器人对未来环境变化的预测能力,包括人类数量估计、当前位置跟踪、未来轨迹预测等功能,且辅助任务仅在训练阶段使用,推理阶段依赖主策略网络,确保应用高效性。
实验显示,Falcon在目标达成和社会合规方面表现出色。在Social-HM3D中成功率和成功路径效率可观,在未训练的Social-MP3D数据集上也有不错成功率;在保持社交距离和避免碰撞上表现良好,达到较高的个人空间合规性和较低的人机碰撞率。定性分析展示了Falcon在人员跟随、复杂交叉路口、正面接近等不同场景中的优越性。
团队还得出三个关键发现:未来感知算法优于以往实时感知算法;辅助任务有助于提高性能,轨迹预测最为关键;SCP和SPM相辅相成,改善性能并加快训练收敛。该项目论文已被ICRA2025接收并挂arXiv,代码和模型权重可在GitHub获取。