目的地搜索
基于完备特征融合的行人轨迹预测方法
2024-05-24 11:30  

行人轨迹不仅由行人本身的意图决定,很多时候也受周围行人的影响。基于Transformer能够自主关注行人间交互信息的特性,我们能够通过Temporal TransformerSpatial Transformer相融合的方式,对行人间的交互信息进行建模。但如何有效的将Temporal TransformerSpatial Transformer相融合是构建提取行人交互信息模型的关键。具体来说,在时间与空间信息都完备的情况下,如何融合时空信息是本项目须要解决的第一个问题。

其次,在特定场景中,行人轨迹遵行一定的社交礼仪(Social Etiquette)。例如,在面对草地或人行道的场景时,行人一般会选择在人行道上行走,而不是穿过草地而行。根据这一原则,我们通过目标导向(Goal Intent)的方式,充分利用当前场景语义信息与对行人历史轨迹信息的融合,建立周遭行人当前帧位置对代理人(Agent)下一帧位置(Goal)的预测模型。然而,如何将场景语义信息与轨迹信息完备融合是建立Goal Intent模型的关键。具体来说,在行人场景与轨迹信息都完备的情况下,以怎样的方式融合场景语义信息与轨迹信息亦是本项目须要解决的第二个问题。

鉴于此,该项目设计一种新颖的基于完备特征的行人轨迹预测方案。具体如下:模型总体由上分支Fusion Transformer与下分支Goal Intent构成。其中,Fusion Transformer模块由Temporal TransformerSpatial Transformer 并行组成。上分支输出融合有行人时空信息的特征。对于下分支,首先将行人轨迹转换为轨迹热图,再将其与场景语义信息相融合,作为Goal Intent输入,输出预测的行人下一帧坐标位置(Goal)。之后,将来自上分支的时空特征与来自下分支的预测坐标(Goal)通过Cross Attention处理融合后,经全连接层输出行人预测坐标,并作为模型下一帧的轨迹输入。

本项目的主要科学发现包括Fusion Transformer和目标导向(Goal Intent)在行人轨迹预测任务中挖掘完备特征的有效性和显著科学性;创新之处在于将Temporal TransformerSpatial Transformer融合考虑,给出了构建时空模型新思路,并将场景语义信息与轨迹信息完备融合,建立了周遭行人当前帧位置对代理人(Agent)下一帧位置的预测模型,从而实现了高精度的行人轨迹预测。通过本项目的研究,我们能够更深入的了解完备特征下行人轨迹预测任务的研究方法,有助于行人轨迹预测及行自动驾驶领域的发展。同时,本项目的研究成果也能够为智能系统的决策和规划提供有力的支持和指导。在学术界方面,本项目的研究成果已经引起了广泛的反响和引用。

关闭窗口

版权所有:天津师范大学 | 地址:天津市西青区宾水西道393号 | 邮政编码:300387 | 电话:022-23766157 |