背景与概述

野火的强度和频率继续增加1,2,3.,4,5,6。例如,2020年加利福尼亚州、俄勒冈州和华盛顿州的火灾风暴烧毁了500多万英亩土地,摧毁了数千座建筑物,导致50多万人撤离,24人死亡7。为了加强应急响应和公共安全,必须扩大对火灾中家庭疏散行为和行动的了解。这些知识可以帮助当局制定适当的应急响应计划,并在野火事件中做出有效的决定。这包括规划交通管理策略、发布疏散令、为处境不利的旅行者提供支持以及进行救援8,9

捕捉疏散人员的路径行为对于估计交通状况、识别交通瓶颈、制定实时交通控制策略具有重要意义。然而,由于缺乏详细的公开数据,对这一主题的研究有限。现有的灾害响应研究主要利用调查和访谈等数据来源研究疏散决策(是否撤离或留下)3.,5,8,9,10。尽管这些数据具有详细的个人层面信息,可以提供对野火疏散决策的基本理解,但它们在疏散过程中对撤离人员运动(即路线行为)的信息有限。此外,由于这些传统数据依赖于人们的记忆,很难收集到准确的疏散路线的时间戳和位置,这给了解他们的运动和估计疏散期间的交通状况带来了挑战。移动GPS数据是通过捕获通过移动设备应用程序传输的卫星ping信号生成的位置数据记录,它提供了一个独特的机会来补充使用问卷收集的数据,并通过提供高粒度的时空运动信息来增强我们对人们疏散路线行为的理解。与调查方法相比,GPS数据集由移动设备自动收集,具有大样本量(例如,数百万个观测值),并提供人们运动的近似时间戳和GPS位置。这些特点使GPS数据成为捕获疏散过程中人的路径行为的合适数据源,可用于验证现有的疏散仿真模型11,12。然而,没有公开的GPS数据集可以让研究人员和从业人员分析人们在野火疏散期间的路线行为

在这项研究中,我们提供了一个来自加利福尼亚州索诺玛县GPS轨迹的公路车辆路线数据集,该数据集代表了2019年金凯德火灾期间人们的运动。金凯德火灾于晚上9点27分在索诺玛县发生。于2019年10月23日下午7点被完全控制。2019年11月6日。大火烧毁了77,758英亩,摧毁了374座建筑物,损坏了60座建筑物,造成4人受伤13。随着火势蔓延,10月26日首次发布了强制疏散令,随后几天,疏散警告和命令扩大到索诺玛县的大部分地区。研究地点、火灾边界和疏散区域(表示疏散警告/命令下的地理区域)如图所示。1

图1
图1

索诺玛县和金凯德消防警戒线。

该数据集可用于研究家庭如何响应野火疏散警告和命令,并探索疏散通知对交通流量的影响。该数据集的潜在用途包括:(1)分析和建模疏散人员的路径选择行为;(2)估计交通状况(如行驶时间、交通流量和速度);(3)验证现有野火疏散模拟模型11,12

方法

GPS数据集(或观测数据)由Gravy Analytics提供TM并建立在隐私友好的移动位置数据上。Gravy每天处理数十亿个原始移动位置信号来构建观测数据——清理和删除数据,以消除欺诈、有问题和重复的数据。Gravy还将Forensic Flags应用于数据,根据信号来源、位置准确性和其他关键特征对有效数据进行分类和过滤。这将高质量的信号与低质量的、可疑的、甚至欺诈性的信号分离开来,并使分析人员能够选择和只使用他们特定用例所需的数据。此外,Gravy Analytics认真对待消费者隐私,并确保其数据符合行业和法律要求。Gravy非常熟悉CCPA、GDPR和世界各地其他隐私法所规定的义务。Gravy与其数据供应商合作,确保公司处理的数据来自已选择收集设备标识符和地理位置信号的设备用户。肉汁在全球范围内应用此标准,无论该要求是否存在于设备所在的司法管辖区。Gravy维护了一个强大的隐私请求渠道,旨在满足世界隐私法所规定的义务。因此,我们的隐私团队会及时响应并遵守他们收到的每个隐私请求。 Users can submit their own opt-out or privacy request on Gravy’s website. For more information on how Gravy protects consumer privacy, see here:https://gravyanalytics.com/consumer-privacy/。如果读者对获得本研究中使用的数据类型感兴趣,可以通过联系表格(https://gravyanalytics.com/contact-us/).然后,一个Gravy的代表会联系你,讨论具体的数据请求和额外的细节,比如付款、交付日期等等。

为了进一步保护用户的隐私并遵守数据提供商的合同要求,我们只提取反映车辆在特定高速公路上的代理入口或出口的数据点(即高速公路上的第一个或最后一个记录)。该数据集不包括可用于推断日常活动位置的记录,但可以提供Kincade火灾之前、期间和之后高速公路上的车辆路线信息。该数据集是匿名的,但它可以为研究人员和从业人员调查居民的疏散行为提供有价值的信息。

预处理的GPS数据包括索诺玛县移动设备用户(为简单起见,我们将其称为以下文本中的用户)从金凯德火灾前一周到火灾后一周(即2019年10月16日至2019年11月13日)的记录。GPS数据的数据库字段包括设备的唯一标识符、geohash纬度、geohash经度、geohash(一种使用短字母数字字符串来表示位置的地理代码格式),在这里可以找到更多详细信息http://geohash.org/site/tips.html)、时间戳、时区和一个指示GPS精度的标志。GPS数据的合成样本如表所示1。为了提取公路车辆路线数据以供发布,我们根据位置和时间戳删除了每个唯一标识符的重复记录。如果一个标识符有多个具有相同位置(即相同geohash)和时间戳(分辨率为1分钟)的记录,则只保留一条记录。我们使用GIS工具将GPS记录与索诺玛县内的高速公路(即美国101号高速公路和1、12、37、116、121和128号州高速公路)进行空间连接(见图2)。2).高速公路中心线有缓冲b米表示公路面积。根据加州公路设计手册14在美国,一条8车道(每个方向4车道)的高速公路的总宽度约为42米。因此,我们假设高速公路的宽度小于50米,即缓冲区设为b= 50米。在空间连接结果的基础上,提取高速公路区域的GPS记录。然后我们根据标识符和时间戳将这些GPS记录加入到轨迹中。我们注意到,该算法可能会在与其他类型道路的高速公路交汇处产生不准确的轨迹。例如,在图1中。4,点p4p7用户的旅行(从p1p10)可以确定为高速公路轨迹。在这种情况下,确定的高速公路轨迹的长度将非常小。因此,我们为已识别的高速公路轨迹设置了最小长度阈值,以消除这些不准确的记录。先前的研究表明,对于自由流速度为65英里/小时的高速公路,两个连续坡道之间的最小距离建议为2500英尺(762米)15,因此,我们将确定的高速公路轨迹的最小长度阈值设置为2500英尺(762米)。我们还删除了具有相同入口和出口位置的重复轨迹,但由于来自同一GPS设备的多个信号,时间戳差异很小(小于1分钟)。在高速公路轨迹的基础上,提取这些轨迹的起点和终点作为车辆进入高速公路的代理入口和出口点。数据处理步骤如图1所示。3.

表1 GPS合成数据样本。
图2
图2

数据处理的一个例子。

图3
图3

原理图概述了数据处理方法。

图4
图4

高速公路与附近其他类型道路互通的例子。

数据记录

公路车辆路线数据集16可从DesignSafe-CI数据门户访问:https://doi.org/10.17603/ds2-9v8w-y830。该数据集包含2019年10月16日至2019年11月13日期间(索诺玛县内)高速公路上的车辆路线。该数据集中的记录总数为21,160。请注意,所有数据都包含在此数据集中。由数据用户来进行过滤。数据集以CSV(逗号分隔值)格式提供。数据字段包括移动设备的匿名标识符、反映车辆高速公路代理入口或出口的位置(即地理哈希纬度和地理哈希经度)、相应的时间戳和相应的高速公路名称。变量的详细说明见表2。我们还提供了高速公路的形状文件(即美国101号高速公路,1、12、37、116、121和128号州高速公路)作为补充文件。在此数据集的基础上,可以直接获得车辆路线信息,以便进一步分析。

表2变量说明。

技术验证

GPS定位记录的精度会影响数据集的质量17,18。因此,为了保证公路车辆路径数据集的质量,我们对GPS数据进行清洗,去除GPS精度较低的记录(即>50米)。GPS精度由GPS数据集中的GPS精度标志(Forensic flag)来标识。法医标志是由GPS数据提供商Gravy Analytics生成的。在这个过程中,我们也消除了重复的观察结果。

的数据生成过程方法Section中,我们首先获得用户在高速公路上的轨迹,然后输出每个轨迹的第一次和最后一次观测值作为代理入口和出口点。换句话说,对于高速公路车辆路由数据集中的每条记录(即行),对应的用户在入口和出口数据点之间的高速公路上行驶。

我们还使用疏散人员每次行程的平均旅行速度分布来验证公路车辆路线数据集。平均行驶速度是用反映用户进出高速公路的数据点之间的路网距离除以相应的行驶时间来估计的。野火发生前(即2019年10月19日(星期六)至2019年10月20日(星期日))和野火发生期间(即2019年10月26日(星期六)至2019年10月27日(星期日))的平均行进速度分布如图所示。56。请注意,大多数疏散发生在2019年10月26日至27日的金凯德大火期间6,因此我们选择这两个日期来生成火灾期间的行进速度分布。由于这两个日期都是周末,因此我们选择2019年10月19日至20日(火灾发生前的周末)生成火灾前的旅行速度分布作为比较。火灾发生前,移动设备用户的平均行驶速度均值为46.84 mph,中位数为45.94 mph,众数为41.19 mph,标准差为18.98 mph。火灾期间,平均行驶速度的平均值为44.74英里/小时,中位数为42.36英里/小时,众数为35.10英里/小时,标准差为19.67英里/小时。我们可以观察到,野火疏散过程中的平均行进速度比野火发生前要小,这一结果与前人的研究结果一致19,20.

图5
图5

行进速度分布(火灾发生前)。

图6
图6

行进速度分布(火灾期间)。

然后,我们测试了火灾发生前和火灾发生时的车速分布是否有显著差异。在这种情况下,我们使用了Kolmogorov-Smirnov检验(K-S检验)21,22评估两个分布是否来自同一数据集。的P-值提供了我们是否可以拒绝两个速度样本来自同一分布的假设的见解。我们对野火发生前和发生时的平均传播速度进行了两样本K-S检验,得到了P-value = 0.0022,远低于常用的0.05阈值,这表明我们有强有力的证据来拒绝原假设。K-S检验结果表明,山火发生前和发生时的平均行进速度分布存在显著差异,这与前人的研究结果一致19,20.

使用笔记

公路车辆路线数据集16作为CSV文件分发,其数据字段汇总在表2以及索诺玛县高速公路的轮廓图。由于数据集是从不同时间间隔的GPS数据集中提取的,数据集显示的入口和出口可能不是实际高速公路入口(即上匝道)和出口(即下匝道)的确切位置。在使用数据进行分析之前,可能需要将它们连接到最近的高速公路出入口。在某些情况下,我们有一个车辆在多个高速公路上的代理入口和出口点,因此必须推断从一条高速公路到另一条高速公路的潜在路径,以估计可能的行驶距离。

公路车辆路线数据集16免费使用/重用。该数据集可以直接用于分析和建模人们在紧急情况发生之前和期间的路线选择。该数据集还可以用于验证现有的疏散模拟工具,特别是通过检查路线选择行为。此外,人们可以利用这个数据集来了解野火疏散期间的旅行延误。由于该数据集提供了车辆代理进出高速公路的位置和时间戳,因此可以使用该数据集估计野火期间两个地点之间的旅行时间。估算的出行时间可以与正常出行时间进行比较,估算出野火疏散过程中的出行延误。利用出行时间和高速公路的代理入口和出口,还可以得出特定高速公路路段的交通速度,以识别野火疏散期间的高速公路热点和瓶颈。此外,该数据集可用于了解交通与建筑环境之间的关联(例如,车道数量、所有车道的总组合宽度、限速、城市面积等),从而为交通基础设施的规划、设计和长期改进提供信息。