通过模仿决策过程了解人群中的人类行为

摘要

人群行为理解是在广泛的应用方面至关重要的，因为人群行为本质上是由基于各种因素的连续决策过程，例如行人自己的目的地，与附近行人的互动和即将到来的事件的互动。在本文中，我们提出了一种新颖的社会意识生成对抗性模仿学习（SA-Gail）的新框架，以模仿人群中行人的潜在决策过程。具体而言，我们通过扩大生成的对抗性模仿学习框架来预测人类决策过程的潜在因素，以预测行人的未来路径。人体决策的不同因素具有相互信息最大化的脱颖而出，通过碰撞正则化和社交意识的LSTMS建模的过程。实验结果表明，我们框架解开了行人潜在决策因素和更强的能力来预测未来轨迹的潜力。

1.引言

随着人口的人口和多样性的人类活动，准确分析人群中的人类行为成为广泛域名，例如视觉监测（邵，Loy，王2014; Shao等，2015），机器人的基本要求在人群中导航（Robicquet等，2016）等。最近，对开发用于建模人群行为的计算方法越来越兴趣，包括视觉陈述（周，王和唐2011; Luber等，2010;周，王，唐达2012;罗德里格兹，阿里和卡德2009），检测异常行为（Mehran，Oyama和Shah 2009）以及行人之间的互动（Andriluka和SIGAL 2012）。尽管需要这些强烈的需求，但是频繁闭塞等人行人的复杂性以及时空跨空间的人类行为的大变化严重阻碍了传统算法的实现。已经提出了很多努力来解决这些问题发情症患者（Su等，2016; 2017; Alahi等，2016; Yi，Li和Wang 2016; Lee等，2017）。然而，这些方法只学习了一个场景的一般历史运动统计，而不会深入调查人群中的人类。
没有更彻底的建模，从视频中学习人群行为部分仍然困难，因为个人运动受到视频不直接捕获的许多因素的影响。人群中的人类行为本质上是由兴趣人员，环境和社会规则（Ali 2008;谢等，2017）的顺序决策过程决定。一般来说，行人首先决定他们的目的地，通过考虑邻近的人群状态来选择路径，并且不断进行小于大多数或避免碰撞的微小修改（见图1（右））。这种基于认知的方法普遍用于人群模拟（Yu和Terzopoulos 2007; Pellegrini等，2009）。然而，基于视觉的分析只有几次尝试，该分析是对简化的规则，能源功能（Pellegrini等，2009;谢等，2017）和网格的规划（Ziebart等，2009），与大量手工制作的设计和动态和功能规范。
不可否认，推断上述行人的决策过程是挑战，因为它是由各种因素的复杂和决定，包括个人意图，邻近的行人和物理障碍（Pellegrini等，2009）。与邻近行人的互动已经由社会汇总层（Alahi等，2016; Lee等，2017）和连贯的RNN（周，唐，王2012; Su等人2016）。然而，行人自己的意图是作为人类行为的内部驱动力的关键作用（Ziebart等，2009;译文，刘和Ziebart 2015;谢等人。2017），仍然是更好的模型。
除了决策因素的数量之外，人类在做出决定之前考虑这些因素的方式也没有得到充分利用。人类并不简单地对他们行事。他们还预计未来国家并促使目前的行动向后。一个典型的例子是当两个人在正交方向上行驶时，他们不断地定位彼此以预测它们是否会碰撞。在几乎所有最近的作品中缺少行动之前，人类模拟即将发生的事情的先天能力。

1.1 我们的提案

根据视觉外观的统计数据不同，我们提出了一种新颖的社会意识到生成的对抗性模仿学习（SA-Gail）框架，以了解人群中行人的决策过程来了解人群行为。具体而言，我们通过预期其未来的路径来推断人类的决策过程，如图1所示，这需要更深入地了解确定活动的行为，而且还要如何展开活动。为此，我们通过扩展最近的生成对抗性仿制学习（GAIL）（HO和ERMON 2016）框架来模仿观察到的轨迹的人类行为，这能够培训通用的神经网络政策，从有限的有限产生专家的运动模式示威。
与现有的监督学习方法相比(Su et al. 2016;2017;Alahi等人2016年;易，李，王2016;模仿学习(IL)，特别是GAIL，更自然地适合人类决策过程(Li, Song, and Ermon 2017)，因为它既有良好的理论分析，也有有效的训练。特别地，训练集中众多的人类轨迹被视为专家演示，反映了人类在拥挤场景下的决策过程。继盖尔之后，我们设计了一个基于循环编译码器框架的生成器(策略)，它试图生成与专家演示相匹配的行为，以及一个判别器，试图将生成的轨迹与专家演示相区分。产生器和鉴别器共同优化为对抗的极大极小对策。
要对行人的潜在意向进行正确的建模，首先要把潜在意向从其他社会因素中剥离出来。为了解决这个问题，我们建议学习语义意义的潜在代码，反映不同的因素的决策过程。具体来说，GAIL (Ho和Ermon 2016)的目标函数进一步扩大了潜在代码和生成路径之间的互信息项(Chen et al. 2016;李，宋，Ermon 2017)。这一修改是基于对相同入口和目的地的行人的观察，因为他们面对不同的社区条件，他们的行为可能仍然不同。因此，潜码提供了一种优雅的方式来表示这种多样性，其中一种设置预期对应于直接走向目的地的策略，另一种设置对应于邻居的影响，如图1(左)的输出所示。值得注意的是，未纠缠的潜在表示是在无监督的方式学习，没有任何人类标记的不同因素。这与传统的受物理启发的社会力量模型不同(Helbing, Farkas和Vicsek 2000;Mehran, Oyama和Shah 2009)，以手工制作的方式定义了驱使行人移动的不同力量。
通过将人类对世界的模拟能力引入SAGAIL，我们进一步模拟了人类的决策过程。这里我们主要考虑的是避碰的本能。受人群模拟理论框架(VanDenBerg et al. 2011)的启发，我们提出了一种原始的跨行人通信模拟机制。每个行人都将他/她想要的候选动作传播给附近的行人，并且只在没有检测到碰撞时才执行它。行人将以最小的努力提前有效地避免即将发生的碰撞。在本文中，我们假设行人选择路径时，在与他人互动的过程中，以最少的运动和转动努力，这就像人们观察邻居并相应地行动一样。
大量的实验表明，SA-GAIL不仅可以理解当前的人群行为，而且可以在深入潜在的决策过程后预测他们未来的路径。总而言之，我们的主要贡献是:

我们首次尝试应用一种新的数据驱动模仿学习框架来模拟行人行为的顺序决策过程。通过模仿过程，我们从一个更类似于人类决策的角度对人群运动进行推理和建模。
以互信息最大化的无监督方式对行人决策的不同因素进行疏解。我们从人与人之间的互动中具体推断出人的意图，赋予政策一定的可解释性。
3.我们通过引入不危害网络训练的冲突避免正则化，将世界模拟的思想引入行为理解。我们的模型表现得更像人类，并避免预测直觉上不合理的路径。

图2:我们提议的SA-GAIL概述。观测轨迹被输入到政策中以产生未来的轨迹。该策略/生成器采用一种编码-解码器架构，其中潜在代码可以与解码器融合，并增强了冲突避免正则化和社会意识。然后将生成的路径与观察到的路径连接起来，送入识别器指导识别器的训练，并送入后验识别器恢复潜在代码。

Understanding Human Behaviors in Crowds by Imitating the Decision-Making Process相关推荐

人群行为分析--Understanding Pedestrian Behaviors from Stationary Crowd Groups
Understanding Pedestrian Behaviors from Stationary Crowd Groups CVPR2015 本文主要探讨静态人群对行人行为的影响人群行为的建模 ...
CVPR 2018 paper list（论文列表）
原文链接:http://cvpr2018.thecvf.com/program/main_conference 52 Embodied Question Answering Abhishek Das ...
CVPR 2018 paper ---object detection
转载:https://blog.csdn.net/qq_34848537/article/details/82968217 参考链接 CVPR 2018 论文解读集锦(9月27日更新) CVPR 20 ...
CVPR 2018 paper
CVPR 2018 参考链接 CVPR 2018 论文解读集锦(9月27日更新) CVPR 2018 open access Paperlist Embodied Question Answering ...
Social LSTM: Human Trajectory Prediction in Crowded Spaces 论文翻译
摘要行人可沿不同的轨道行走,以避开障碍物及方便其他行人.在这样的场景中行驶的任何自动驾驶车辆都应该能够预见行人未来的位置,并相应地调整其路径以避免碰撞.轨迹预测问题可以看作是一个序列生成任务,我们感 ...
[VQA文献阅读] FloodNet: A High Resolution Aerial Imagery Dataset for Post Flood Scene Understanding
背景文章题目:<FloodNet: A High Resolution Aerial Imagery Dataset for Post Flood Scene Understanding> ...
报名 | 2019年社会计算机国际会议
2019 International Conference of Social Computing, Tsinghua University Program 2019年社会计算机国际会议 2019.0 ...
CVPR 2015 papers
CVPR 2015 CVPR 2015的文章可以下载了,如果链接无法下载,可以在Google上通过搜索paper名字下载(友情提示:可以使用filetype:pdf命令). Going Deeper ...
（十三：2020.08.28）CVPR 2015 追踪之论文纲要（译）
CVPR 2020 追踪之论文纲要(修正于2020.08.27) 讲在前面论文目录讲在前面论坛很多博客都对论文做了总结和分类,但就医学领域而言,对这些论文的筛选信息显然需要更加精细的把控,所以自 ...

Understanding Human Behaviors in Crowds by Imitating the Decision-Making Process

摘要

1.引言

1.1 我们的提案

Understanding Human Behaviors in Crowds by Imitating the Decision-Making Process相关推荐

最新文章

热门文章