首页 首页 大数据 查看内容

大数据告诉你:什么地方容易发生严重交通事故?

木马童年 2019-8-21 05:40 109 0

作者:团支书、魏小帅 城市数据团 数据支持:上海开放数据创新应用大赛、高德地图、城市数据团 中秋节结束了,你是否还沉浸在“又要上班了”的悲痛之中? 然而,尽管有些悲痛,一旦走出家门,就要打起十二万分的精神 ...

作者:团支书、魏小帅 城市数据团

数据支持:上海开放数据创新应用大赛、高德地图、城市数据团

中秋节结束了,你是否还沉浸在“又要上班了”的悲痛之中?

然而,尽管有些悲痛,一旦走出家门,就要打起十二万分的精神,面对外界的风风雨雨。

大数据告诉你:什么地方容易发生严重交通事故?

在迎向风雨的路上,哪些地方最容易发生交通事故呢?

我们利用了今年上海开放数据创新应用大赛(SODA)初赛提供的2014.10.1-2015.4.9的交通事故样例数据,将交通事故发生的地点落在地图上,结合空间算法和文本识别,统计出每条道路上发生的事故数量,绘制出了这张“上海交通事故”地图。

在图上,红色的点表示事故发生地点;蓝色线条代表道路,颜色越深、线条越粗,说明该条道路上发生的交通事故数量越多;橙黄色区域为根据事故点热力识别出的事故高发地区。

大数据告诉你:什么地方容易发生严重交通事故?

如上图所示,事故高发路段主要是由市中心向外延伸的若干主要道路和环城快速路,如沪杭高速、沪金高速、沪渝高速、申嘉湖高速、外环高速、浦星公路、沈海高速等,而市中心道路则相对较少。

而从高发地区上看,则呈现为一条穿过市中心的、东北-西南走向的连绵带状区域,如宝山杨行码头附近-四川北路区域-松江老城,另外在宝山、松江沪杭高速沿线、沪金高速沿线和外高桥多有分布。而浦西地区的高发地区明显比浦东更加蔓延和密集。

我们不妨总结一下,容易发生事故的地区都有什么特点?

我们选出了16个事故最为高发的地区,并收集和统计了关于这些地区的各种指标,包括:

事故密度(单位面积事故数量)

区域面积

路网密度(单位面积土地上的道路长度)

*早高峰出行量密度(工作日7-9点的单位面积出行量)

事故发生地与交叉口的距离

工作日事故数量占全部事故数量的比例

白天(早7点到晚8点)事故数量占全部事故数量的比例

这些指标中,有些是对事故发生情况的客观描述,对事故发生率并无直接贡献,但可能有助于我们对事故发生的原因进行推测。

这16个事故高发地区落在地图上长这样:

大数据告诉你:什么地方容易发生严重交通事故?

接下来,我们采用系统聚类法将16个事故高发路段分为了3类,情况结果如下图所示(“红-白-蓝”的渐变分别代表指标相对值的“高-中-低”;表中数值为归一化以后的结果,非绝对数值):

大数据告诉你:什么地方容易发生严重交通事故?

分类后的空间地图大概长这样:

大数据告诉你:什么地方容易发生严重交通事故?

据此,我们可以大致总结一下事故易发地区的几个特征。

第一类事故高发地区:人多车多,路况复杂的中心城区。

这一类地区包括四川北路、甘泉路石泉路、鲁班路大木桥路等,多位于市中心。

从十六个事故高发区的特征来看,路网密度和出行量密度高,事故密度相应也较高。简单关联一下道路密度与事故率的关系,可以看到二者在0.01的水平上显著相关。绘制出散点图长这样:

大数据告诉你:什么地方容易发生严重交通事故?

如上图所示,路网密度越高的地区,事故密度也越高,说明二者间可能存在着某些关联。

这可能是因为路网越密,单位长度道路上的交叉口就越多,意味着行车速度变化越频繁和视线遮挡越多,因而交通事故率就愈高。

当然,如果只是道路密度高不足以诱发众多的交通事故。但当这些密密麻麻的道路上挤满了车的时候,情况就不同了。

事实上,道路拥挤程度(交通饱和度)与事故率的关系非常复杂。根据学者景天然的研究,当交通饱和度上升时,事故率先增后减,事故率在交通饱和度为0.7-0.8时达到峰值。换句话说,道路较为拥堵的时候最容易出事故,而车流较少和严重拥堵时则相对安全。

大数据告诉你:什么地方容易发生严重交通事故?

图片来源:景天然.城市道路条件与交通事故率的关系[J].同济大学学报,1992(20)3:335-340.

由于我们不掌握各条道路的交通饱和度数据,仅能探究单位密度的出行量与事故率之间的关系。

先来看看上海哪些地方的出行量密度最高呢?

大数据告诉你:什么地方容易发生严重交通事故?

左上图是上海典型早高峰日的出行量密度分布图。如果我们将这张图与事故高发地点的图(右上)进行比较的话,会发现二者间有着一定程度的相似,如在中心城区密集和向外扩散的方向;但从细节而言,二者又有若干不同,如宝山地区的出行密度并不高,但事故率很高;浦东花木地区出行密度高,但事故率并不高。

总的来说,在我们的研究样本范围内,出行量密度与事故率在0.01的水平上具有显著相关性,绘制出散点图如下图所示:

大数据告诉你:什么地方容易发生严重交通事故?

换句话说,出行量密度越高的地区,发生交通事故的概率也越大。

当然,这个结论并不是绝对的。出行量密度只是影响交通事故率的众多因素之一。事实上,在许多路网密度和出行量密度都不算太高的郊区,同样可能有较高的事故率。

第二类事故高发地区:接驳轨交通勤,助动车盛行的近郊。

虽然从第一类地区上去看,出行量和道路密度与事故率有很高的相关性,但第二类地区则表现出完全不同的特性。

比如嘉定北、航中路西、闵行开发区、美兰湖等,该类地区在出行量和道路密度上都没有明显的,但其事故比例都很高。

这是为什么呢?我们不妨先来看看这些地区都位于上海的哪里。

大数据告诉你:什么地方容易发生严重交通事故?

没错,第二类事故高发区多位于郊区的轨交站点附近,有着大量与轨交接驳的需求,但该类地区的公交车和出租车均不够便利。

以美兰湖北地区为例,该地区的公交站点密度仅为2.6个/km2,远低于市中心四川北路宝山路的11.7个/km2,只有不到四分之一。

大数据告诉你:什么地方容易发生严重交通事故?

为了弥补这些地区公交不发达的缺陷,助动车和黑车大量出现在轨交站点周边。至于助动车、黑车跟事故的关系嘛,你懂的。

在第一、第二类以外,还有第三类地区。它们同样位于郊区,但却并不在轨交站点附近。

第三类事故高发地区:高速公路沿线和货运码头附近。

第三类事故高发区主要包括宝山杨行、外高桥、沪嘉高速北等地区。这些地区不仅位于比第二类地区更为偏远的郊区,而且往往在高速公路沿线或码头附近,担负着上海对外交通的重任。

当然,除了交通更偏远以外,这些地区有一个非常显著的特点:夜间事故率高。

是的,之前我们对于事故率的分析大部分集中在空间上,假如我们按照时间序列去判断的话,就可以发现:上海的交通事故量在全天时间段上的分布相对平稳(除了在中午12点有个明显的低谷)。

大数据告诉你:什么地方容易发生严重交通事故?

但是,我们所清楚的是:上海这座城市的出行量并不是每个小时恒定的,而是有明显的早晚高峰特征。那么,虽然事故发生的总量每个小时波动不大,但增加了出行量的时间分布后,我们会发现,事故发生几率的小时差异立刻就变得异常明显了,请看下图:

大数据告诉你:什么地方容易发生严重交通事故?

为什么夜间的事故率这么高呢?简单地说,夜间行车本来就有道路环境不够明亮、驾驶员状态下降等不利因素,而在高速公路和码头,夜间还有许多执行任务的货运汽车,使得这些地区的夜间事故率进一步提高了。

总结一下,上海容易发生交通事故的主要有以下三类地区:

1.人多车多、出行量大、路况复杂的中心城区;

2.接驳轨交通勤、助动车盛行的近郊;

3.高速公路沿线和货运码头附近。

因此,当我们在市中心闲逛的时候,尽量观察周边复杂的交通环境;当我们在郊区出了地铁站后,尽量小心飞驰而来的助动车;当我们需要前往货运车辆经常出没的地区时,尽量避免在后半夜出门……

当然,安全第一,小心总是很重要的。但事实上,根据上海市公安局交通警察总队提供的数据,上海2014全年有记录的交通事故只有1172起,跟全市304万辆注册机动车、3168万人次的中心城日均出行量相比,实在不算什么。

交通事故,毕竟是小概率事件。

城市和人生的道路上本就有各种风险,怎么能因为害怕风险就拒绝上路呢?

在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!

未分类
0
为您推荐
大数据技术改变城市的运作方式,智慧城市呼之欲出

大数据技术改变城市的运作方式,智慧城市呼

纽奥良虽像大多数城市一样有火灾侦测器安装计划,但直到最近还是要由市民主动申装。纽…...

大数据分析面临生死边缘,未来之路怎么走?

大数据分析面临生死边缘,未来之路怎么走?

大数据分析开始朝着营销落地,尤其像数果智能这类服务于企业的大数据分析供应商,不仅…...

什么是工业大数据,要通过3B和3C来理解?

什么是工业大数据,要通过3B和3C来理解?

核心提示:工业视角的转变如果说前三次工业革命分别从机械化、规模化、标准化、和自动…...

大数据普及为什么说肥了芯片厂商?

大数据普及为什么说肥了芯片厂商?

科技界默默无闻的存在,芯片行业年规模增长到了3520亿美元。半导体给无人驾驶汽车带来…...

大数据技术有哪些,为什么说云计算能力是大数据的根本!

大数据技术有哪些,为什么说云计算能力是大

历史规律告诉我们,任何一次大型技术革命,早期人们总是高估它的影响,会有一轮一轮的…...

个人征信牌照推迟落地,大数据 重新定义个人信用!!

个人征信牌照推迟落地,大数据 重新定义个

为金融学的基础正日益坚实。通过互联网大数据精准记录海量个人行为,进而形成分析结论…...