使用交通摄像头图像得出繁忙程度指标:实验研究——英国国家统计局

1.简介

交通摄像头是了解城镇活动水平以及不断变化的交通模式的宝贵资源。英国有数以千计的公共交通摄像头，供应商从国家机构到地方当局都有。这些包括:

高速公路,是谁从1500个摄像头中传输图像位于英格兰主要道路系统的对面
交通威尔士
伦敦交通局，拥有900多个摄像头
雷丁区议会

交通摄像头拍摄的图像是公开的，分辨率低，不允许单独识别人或车辆。然而，我们的研究表明，它们是城市地区整体“忙碌”水平的一个很好的指标。因此，这些数据是对其他流动性和交通数据的宝贵补充，以了解冠状病毒(COVID-19)大流行期间行为模式变化的经济和社会影响。

关于这项实验研究的更多信息可在数据科学校园博客．

目前这些指标并非如此官方统计数据被认为是实验．它们提供了洞察力和价值，但在接下来的几周和几个月里，它们将进一步得到改进。因此，您可以期待这些系列的修订。

回到目录

2.数据源

交通摄像头数据源通常由静态图像或从静态摄像头拍摄的视频剪辑组成。这些来源是公开的，通常提供低分辨率的图像(见图1)。这些来源的优点之一是相机更新非常频繁，通常每隔几分钟就有新的图像可用。这允许构建对象(如行人或汽车)的计数，以捕获整个星期中不同时间的活动水平。

图1:伦敦圣贾尔斯马戏团的交通摄像头视频片段。汽车、行人和公共汽车在图像中清晰可见

资料来源:伦敦交通局

下载此图像图1:伦敦圣贾尔斯马戏团的交通摄像头视频片段。汽车、行人和公共汽车在图像中清晰可见

.png (446.9 kB)

这种类型的交通摄像机的主要限制是:

并不是每一辆经过摄像头的车辆或行人都被计算在内，因为镜头只是定期拍摄的
无法提供关于流动的任何信息，例如起源、目的地或旅行路线
计数的准确性取决于多个方面，如物体的遮挡、照明、天气、机器学习模型的选择、训练集和相机图像分辨率

因此，这一来源更适合于对城市地区的“繁忙”或活动进行全面估计，以补充其他更快的指标。

我们审查过的开放网站的完整列表可在数据科学校园博客．

我们从列表中选择了一部分网站，并在它们的相机上建立了历史活动的概要。我们选择:

达勒姆(自2020年5月7日起)。
伦敦(2020年3月11日)
曼彻斯特(2020年4月17日)
北东(2020年3月1日)
北爱尔兰(2020年5月15日)
绍森德(2020年5月7日)
阅读(2020年5月7日)

这些地点覆盖了整个英国，同时也代表了城市和农村环境中一系列不同规模的定居点。

回到目录

3.我们如何衡量忙碌程度

我们制作的系列旨在估计城镇中的“繁忙”程度(行人和车辆活动)。它依靠自动化的云基础设施传输和存储来自公共交通摄像头的图像，然后分析这些图像。在检索图像之后，处理可以大致分为机器学习管道，然后是用于时间序列分析的统计管道。

机器学习的管道

机器学习管道是从图像中定位和识别车辆和行人的语义对象，并产生运动对象的计数(见图2)。图2中灰色显示的数据流处理来自单幅图像的空间信息。也就是说，每个图像都是独立处理的，而不考虑在它之前或之后捕获的其他图像。蓝色流处理图像及其最近邻近图像的空间和时间信息。

图2:表示物体检测的不同阶段的图表，以便统计交通摄像机图像中运动物体的数量

资料来源:英国国家统计局

下载此图像图2:表示物体检测的不同阶段的图表，以便统计交通摄像机图像中运动物体的数量

.png (17.7 kB)

理想情况下，每10分钟从相机获取新图像，例如通过应用程序编程接口(API)或从Amazon实时存储。但是，在实际操作中，如果主机没有及时更新映像，则可能会复制映像。摄像头可以定期离线并显示虚拟图像。由于相机的物理问题，图像也可能部分或完全扭曲。因此，数据清理是去除这些有问题的图像，从而提高统计输出质量的重要部分。

目标检测步骤使用空间信息在单幅图像上识别车辆和行人。这里有一个深度学习模型，叫做基于区域的快速卷积神经网络(fast - rcnn)应用。

当我们的目标是检测活动时，使用时间信息过滤静态对象(如停放的车辆)是很重要的。静态掩码步骤应用结构相似性度量(SSIM)精确的背景，然后确定行人和车辆是静态的还是移动的。仅对运动对象进行计数以生成时间序列。

关于机器学习管道的算法、评估和验证的更多细节可以在博客中找到。

时间序列处理与分析

一旦交通摄像头的对象计数可用，我们执行一系列处理步骤:

弥补缺失或低质量的图像
将摄像头聚集到城镇或城市级别
去除季节性因素以促进结果的解释

交通摄像头时间序列的方法已经更新，从2020年8月31日至9月6日当周(2020年9月10日发布)对应的数据开始。从这一天起，不再对整个系列应用季节分解imputation，而是将其应用于最近四周的数据，之前的估算数据保持不变。这种变化的主要好处是使处理更简单和更快，这允许有更多的时间来保证结果的质量。

归因包括识别来自每个摄像机的数据缺失时段，然后用估计值替换每种对象类型的这些缺失计数(通常是由于技术故障而缺失)。我们利用季节分解进行了归责。首先，去除序列的季节性，然后对缺失的周期进行均值计算，然后重新应用该序列的季节性。该归责法应用于在R中ImputeTS包．

在计算之后，每个对象类型的计数将针对每个感兴趣的位置进行聚合。例如，对于Reading，将所有交通摄像头统计的所有车辆(包括估算的计数)相加以生成车辆时间序列。

一旦该系列被汇总，我们会对每个系列进行季节性调整，以使结果的解释更加清晰。季节性调整从数据中消除了由于一天中的某个时间或一周中的某一天而产生的波动，从而更容易观察数据中的潜在趋势。我们采用季节调整使用TRAMO /座位每小时，以及每天的时间序列。数据还进行了转换，以消除季节调整过程导致负值的可能性。

数据的表示

对于速度较快的指标，数据以每日周期的若干时间序列表示。这些系列每周更新，并进行季节性调整，以方便识别数据趋势。

回到目录

4.来源的优势和局限性

交通摄像头的数据最适合检测城镇和城市中心的“繁忙”或活动趋势。它们不适合用于估计车辆或行人的总体移动量，也不适合用于了解所进行的行程。它们提供高频率(每小时)和及时(每周)的数据，有助于发现社会行为的趋势和拐点。因此，它们提供了对移动性和运输数据的补充。

的优势

交通摄像头数据分析有许多优点。

这些数据非常及时。我们可以处理前一天的数据，我们每周都可以生成这些数据。如果需要，可以扩展该流程以生成更频繁的时间序列，例如每天更新仪表板。

检测到大量不同的对象。交通摄像头管道可以让我们检测到汽车、公共汽车、摩托车、货车、行人等等。事实上，这是为数不多的可以检测人行道上行人的数据来源之一。

重用公共资源。该系列进一步利用了地方当局和交通机构已经收集的交通摄像头图像。因此，收集它们没有额外的成本。

它具有成本效益。制作这些系列的云基础设施每月花费数百英镑。这大大低于由工作人员识别不同车辆类型或为执行同等任务部署基础设施的相关费用。

市中心覆盖范围。这些摄像头可以覆盖城镇中心，以及许多零售或通勤交通和行人流量的地区。

大量的摄像头。有一个庞大的、已经可用的交通摄像头网络，对于每个地点，我们都可以同时接入许多这样的摄像头。

个人和车辆的身份尚未确定。不会存储或处理个人或车辆的任何细节，如车牌或人脸。

限制

覆盖范围有限。虽然有很多交通摄像头，但都集中在城镇。在较小的定居点更难找到交通摄像头。目前我们没有为威尔士制作任何系列。

准确性取决于外部因素。探测不同物体类型的准确性取决于我们无法控制的许多因素。例如，相机的定位可能会使探测某些物体类型变得困难，而且图像质量取决于天气和技术。

计数总是被低估。放置在道路上的传感器可以用来计数每一辆经过传感器的车辆，但交通摄像头图像只提供定期间隔的图像，并且依赖于机器学习模型的准确性来计数物体。因此，这个来源更适合于估计趋势，而不是绝对数字。

回到目录

5.与其他来源的比较

运输部的交通数据

英国交通部(DfT)为英国制作道路交通统计数据来自275个自动流量统计站点。此外，他们还提供了自行车、公共汽车和铁路旅行的统计数据。他们的车辆数量进一步分为轿车、轻型商用车和重型货车。

这些数据不能与交通摄像头数据直接比较，因为覆盖范围不同(整个英国而不是选择城镇和城市)，但它用于评估交通摄像头源是否可以用于估计交通的拐点。图3和图4分别显示了伦敦和东北部(纽卡斯尔和桑德兰)的交通摄像头源和DfT的所有车辆活动。DfT数据反映了英国的运动。请注意，交通相机系列已季节性调整，以减少一些与工作日相关的变化。

图3:相对于2020年3月11日伦敦的交通摄像头活动程度，以及DfT相对于2020年2月同期的英国道路交通估计水平

每日统计所有机动车辆，季节性调整，伦敦和英国

资料来源:伦敦交通局，运输部

下载此图表图3:相对于2020年3月11日伦敦的交通摄像头活动程度，以及DfT相对于2020年2月同期的英国道路交通估计水平

图像 . csv xls

图4:相对于2020年3月1日，英国东北部的交通摄像头活动程度，以及相对于2020年2月同期的英国道路交通估计水平

每日统计所有机动车辆，季节性调整，伦敦和英国

资料来源:东北交通摄像头，运输部

下载此图表图4:相对于2020年3月1日，英国东北部的交通摄像头活动程度，以及相对于2020年2月同期的英国道路交通估计水平

图像 . csv xls

考虑到覆盖范围的差异，以及统计地点(高速公路，城市和农村)和交通摄像头(仅城市)的位置，这两个来源在3月中下旬提供了类似的活动拐点。同样，从5月起，这两个来源都提供了类似的活动增加趋势，只是水平略有不同。

谷歌移动数据

谷歌和Apple提供了关于多个类别场所(如杂货店、零售和娱乐场所或工作场所)移动趋势的汇总报告。在图5和图6中，我们比较了谷歌生产的流动性系列我们分别从伦敦和东北部的交通摄像头估计出的行人活动。谷歌数据使用的基线是基于2020年1月3日至2月6日期间每周每天的中位数。

图5:大伦敦地区交通摄像头行人计数与谷歌移动数据的比较

每日行人统计，季节性调整，大伦敦

资料来源:伦敦交通局，谷歌移动数据

下载此图表图5:大伦敦地区交通摄像头行人计数与谷歌移动数据的比较

图像 . csv xls

图6:英格兰东北部(泰恩赛德)的交通摄像头行人计数与谷歌移动数据的比较

每日行人统计，季节性调整，泰恩赛德

来源:东北交通摄像头，谷歌移动数据

下载此图表图6:英格兰东北部(泰恩赛德)的交通摄像头行人计数与谷歌移动数据的比较

图像 . csv xls

在这些级数中，关于数据中的拐点，级数之间有很好的对应关系。但是，在水平上存在显著差异，谷歌移动数据包括个人对感兴趣地点的所有移动，而交通摄像头数据包括选定街道上行人的所有观察。交通摄像头系列也可能会计算那些没有访问谷歌分析的任何目的地的行人。值得注意的是，谷歌数据中的一些访问者可能是乘坐汽车访问的，这不会反映在行人时间序列中。

回到目录

6.相关链接

冠状病毒和英国经济和社会的最新指标
公告|每周发布
关于冠状病毒(COVID-19)对英国经济和社会影响的早期实验数据这些更快的指标是通过快速反应调查、新数据源和实验方法创建的。

通过城镇和城市交通摄像头估计车辆和行人的活动情况
博客| 2020年9月3日发布
关于机器学习管道的算法、评估和验证的更多细节。

回到目录

利用交通摄像头图像得出繁忙程度指标:实验研究

目录

1.简介

2.数据源

图1:伦敦圣贾尔斯马戏团的交通摄像头视频片段。汽车、行人和公共汽车在图像中清晰可见

资料来源:伦敦交通局

下载此图像图1:伦敦圣贾尔斯马戏团的交通摄像头视频片段。汽车、行人和公共汽车在图像中清晰可见