快速公交乘客出行的时空规律特征研究
[摘要]借助成都市快速公交智能卡数据,定义并定量研究了乘客出行的时空规律度,并且用熵定义了乘客的可预测性。研究结果表明,时空规律特征与可预测性之间存在线性回归函数关系。
[关键词]大数据;公共信息系统;时空规律特征;可预测性
[中图分类号]F570.71 [文献标识码]A [文章编号]1005—152X(2017)03—0097—04
1引言
交通工程学研究的是人在城市内的移动,其研究者通过问卷调查等传统方法收集居民的日常出行数据,并根据这些数据建立模型来预测交通流量,研究公交出行顾客满意度,或者评价与优化线路、运营。但这些传统的调查方法往往成本较高,难以大规模、长时间地对人类运动行为进行观测记录。随着信息技术的发展,已有越来越多的手段(如手机定位系统、GPS等)可以长期记录人类个体的移动数据,这些数据为采用统计方法研究人的时空运动行为提供了可能。近年来研究者先后通过对美元流通数据、手机通信记录等数据进行了实证统计研究发现,人类的空间运动模式具有时空规则性,如以天为周期频繁返回少数几个地点,不同个体的空间概率密度分布高度相似,移动轨迹具有高度可预测性。
利用不同数据进行的统计实证发现人类时间、空间运动模式中存在许多共同的统计特性,如连续两次行为时间间隔、移动距离服从某种特定的分布,暗示着可能存在支配人类空间运动行为的普适性机制。最近的研究更多地从社交网络、社会网络的角度来理解人群的移动特性,文献[1]研究了乘客出行时间规律度与相遇陌生人这一现象之间的关系,文献[10]指出人在城市中的移动与社交需要密不可分。
在大量实证研究的基础上,有学者开始对人类移动行为建模,返回偏好模型认为人类具有探索未知地点的倾向,也有一定概率返回之前熟悉地点;基于层次性交通系统的人类运动模型认为人类的出行行为受到所处的物理环境即交通系统的限制,所以就像交通系统一样,也是层次性的。此外,还有其他如信息熵优化模型、周期性随机游走模型等模型。这些模型从不同角度对人类空间运动行为进行了深入的探讨,解释了部分人类运动的时间和空间规律现象,加深了人们对于自身空间运动行为的理解。但是,存在的问题是:(1)上述模型假设所有个体都按相同的模式移动,这与现实不符;(2)已有文献都是对时空特性或者可预测性进行研究,还没有同时探讨二者关系的研究。本文借助成都市快速公交智能卡数据对上诉不足进行了补充。
2数据描述
2.1数据介绍
本文所分析的数据来自成都市公交集团,包括了自2013年6月11日到2013年8月20日成都市二环快速公交共1080 371位匿名用户的17 332 277条出行记录,本文主要使用的数据项见表1。成都市二环路快速公交线路为环型,运营线路共2条(顺时针K1线和逆时针K2线),共有28对站点,具体站点分布如图1所示。
目前成都二环路快速公交运行在二环路高架桥上,全长28.3km,设计速度80km/h,全天总班次约1200余班,最高单日载客量可达28万人次,在一定程度上缓解了成都市的市内拥堵问题。
2.2数据处理
首先在原始数据的基础上,删除了格式记录错误和逻辑错误数据,在计算乘客连续出行时间间隔、连续出行距离差的时候,只保留了出行频率大于1次的乘客,在计算乘客出行时间规律度时,为了使规律更加清晰,计算对象为出行频率不少于10次的乘客。
3乘客出行的时间特征
3.1出行时间分布
通过公交智能卡数据记录的每一次刷卡信息,我们可以得到公交乘客日常出行的时间分布,如图2所示,可以看到显著的早晚高峰,暗示了城市人群的大量通勤行为。文献[5]通过分析早晚高峰不同站点的刷卡信息,分析了深圳市的日常通勤模式和居住地一工作地两者之间的空间分布。
3.2出行时间间隔分布
同一个体连续2次相同行为的间隔时间分布,是人类行为时间特性研究的重要内容,最初上述时间间隔被认为服从负指数分布,并且将人类的连续相同行为看做泊松过程,而近几年通过分析人们活动的大量数据,从通讯、工作到娱乐,越来越多的证据显示人们的许多行为的时间统计特性无法用泊松过程刻画。特别的,这些行为所对应的间隔时间分部具有明显偏离指数分布的肥胖的尾部,例如人们通过数字网络包括移动电话、电子邮件和在线信息所进行的通讯活动,两次连续的通讯活动的时间间隔τ就不服从泊松分布,而是服从带有指数截断的幂指数分布:
其中β和τc为参数。
分布P(τ)刻画了人类通信活动的阵发性,即两次连续事件之间的时间间隔分部并不均匀。本文通过公交出行这一典型行为考察乘客连续出行的时间间隔分布,从直觉上考虑,出行活动相比于通信行为明显应该更加规律,特别对于日复一日的通勤人群而言更是如此。
為了描绘出行时间间隔的分布,本文选取了1072 774名使用频率大于1次的乘客,计算得到了17 324 680次使用快速公交连续出行的时间间隔,间隔时间τ的分布如图3所示,可以看到,并不像通信活动那样,出行活动具有清晰的时间间隔模式。既非指数也不服从幂指数分布,大多数情况下,乘客在18h间隔以内进行第二次出行活动,在此期间,可以看到2个高峰:
0-2h,主要由于换乘所致;
10-14.5h,暗示了日常的通勤模式;
当间隔时间大于18h之后,在24、48、72、96h显示出类似并且逐步减弱的高峰,这些峰值捕捉到了城市人群日常乘坐公交出行的趋势,显示出人群移动显著的规律性。值得一提的是,成都市快速公交实施两小时免费换乘3次的优惠,从乘客连续2次刷卡间隔分布来看,是有一定科学依据的。类似的分析也可以为其他城市或者普通公交制定相应政策提供帮助。
4出行时空规律与可预测性
4.1个人时空规律特征
文献[1]中定义并计算了新加坡不同公交乘客出行的时间规律度,并且得到结论:相遇“熟悉的陌生人(即经常在同一地点相遇的素不相识的人)”概率越大的乘客群体,时间规律度分布越稳定。本文使用相似的定义,来度量个人出行时空规律度,并考察个人出行时空规律特征与可预测性之间的关系。