热门关键词:

基于超越对数函数的道路交通事故频数预测

  • 该文件为pdf格式
  • 文件大小:406.6KB
  • 浏览次数
  • 发布时间:2014-11-06
文件介绍:
本资料包含pdf文件1个,下载需要1积分

Research on Traffic Accident Frequency PredictionBased on Translog Production FunctionLI Rong ,LIU Xiang。LIU Jian(State Key Laboratory of Advanced Design and Manufacturing for Vehicle Body-Hunan Univ,Changsha-Hunan 410082。China)Abstract:Aiming at the limitation of the traditional log-linear model widely applied to frequency pre-diction of traffic accidents,in which the elasticity is assumed as constant and the interrelation of the explo-sive variables is simplified,a new frequency prediction model of traffic accidents based on translog produc-tion function was proposed.Adopting a dynamic elasticity,the model predicts the accident frequency ac-cording to two major variables:traffic flow and the length of section.The Ontario accident statistics fromCanada has verified its effectiveness and better goodness of fit compared with the traditional log-linearmode1。

Key words:log-linear model;translog production function;accidents;frequency;prediction识别影响道路交通安全的因素,探索各因素对道路交通安全的影响机制、影响效果以及因素之间的相互关系,并建立道路交通事故频数预测模型是道路交通安全研究的-项重要内容 .该研究对于道路交通事故预防、道路交通安全改善具有极为重要的意 义。

目前,国内外道路交通安全研究中有关事故频数预测模型的研究归为两大类:-类模型中探索性变量包含道路交通中多个功能性和几何性特征变量因子 ,主要侧重于分析多变量影响因子对道路交通收稿 Et期 :2012-08-20基金项目:国家科技重大专项(2011ZX04015-041);汽车车身先进设计制造国家重点实验室自 (71075005)作者简介:李 蓉(1976-),女,湖南永州人,湖南大学副教授,硕士生导师十通讯联系人 ,E-mail:jyylirong###hnu.edu.cn50 湖南大学学报(自然科学版)安全的影响机制、影响效果以及探索性变量之间的相互关系口],如 Venkataraman Shankar[2]研究 了道路弯曲度和坡度、最大降雨量、每月降雨天数、最大降雪量、设计车速、车道数量和车流量等变量对事故频数的影响;另-类则仅研究单个探索性变量对道路交通安全的影响 ,称为单变量模型 ,如专门研究车流量对道路安全影响的车流量模型。

构建道路交通事故频数预测模型时常使用广义线性模型(Generalized Linear Models,GLM)来描述各探索性变量与道路交通事故风险或事故概率之间的效果或关系 ],并基于此预测在特定条件和时间区间内所发生的交通事故频次.GLM 通常采用对数变换对乘数方程进行线性化,因此又称为对数-线性回归模型(Log-Linear Mode1).采用传统对数线性回归模型对道路交通事故进行统计分析研究通常基于以下假设:所有的参数估计均为基于常量的弹性系数 ].该假设对于研究探索性变量对道路交通事故风险的影响具有-定的局限性和误导性 :如研究路段长度对于道路交通安全风险的影响时,较长的路段变化 1 和较短的路段变化 1 对道路交通安全的影响效果必然存在差异;又如在研究车流量对道路交通安全的影响时,较低车流量和较高车流量变化 1 对道路交通事故频数的影响也不-致.由上述分析可知:假设探索性变量的弹性系数为变量将更符合常识,更为合理。

目前,道路交通安全研究侧重于分析探索性变量集从-个状态转变为另-个状态时对交通安全的影响差异,而对探索性变量间相互关系的量化研究较少[ .以探索性变量--路段长度为例,该变量可能改变车流量对道路交通事故频数的影响,即相同的车流量对道路交通事故频数的影响在-定程度上撒于所选分析路段的长短。

由上述分析可知,传统的对数-线性回归模型用于分析与预测道路交通事故频数时存在两个局限与不足 :-是弹性系数为常数的假设不符合常识和逻辑;二是模型简化或者理想化 了探索性变量之间的相互关系 ,难 以真实反映变量之间的相互影响.鉴于此,本文将计量经济学 中广泛应用的超越对数函数[7-io 引入到道路交通事故频数的统计分析与预测研究中,选择路段长度和年平均车流量这两个探索性变量预测道路交通事故频数,并与传统对数-线性回归模型进行对比研究,模型预测值和实际观测值的对比结果表明,超越对数函数模型较传统的对数-线性模型具有更好的拟合优度和更为精确的预测性能。

1 基于超越对数 函数的道路交通事故频数预测方法1.1 传统负二项回归预测模型在道路交通事故频数分析预测中常采用广义线性模型中的负二项回归模型 .该模型假设特定时间段内事故发生的频数服从负二项分布,其概率质量函数如下 :P(y- l ,a)- ·( ) · ) . (1)式中:a是分散系数,当a趋近于 0时,负二项分布退化成泊松分布;/I 为路段i道路交通事故频数的期望值 ;Y 为路径 i道路交通事故频数 的实际观测值;F为伽马函数。

路段 i道路交通事故频数的期望值 E( ),观测值 Y 和方差 Var(y )关系如下:- E(y ), (2)Var(y )- [1 ]. (3)道路交通事故频数期望值的回归预测方程如下 : 、1n( )- BX . (4)式中:X 是由路段 i的道路几何特征 、天气和环境特征等k个探索性变量z 构成的自变量向量; 是对应自变量的回归系数估计值构成的向量,可根据最大似然函数方法进行估计获得。

1.2 超越对数函数模型在超越对数 函数模型 中,可假定其回归预测 函数如下 :in( )f(1n l,In oZ"2,,In z ). (5)在点 z-[0,0 .,0]处将上述函数展开成二阶泰勒级数 ,可得 :In(j,)厂(0)∑Eof(·)/aln(五)]1。In(五)告∑∑[a 厂(·)/31n(五)Oln( )k:。X1 J 11n (z )ln( ). (6)令常量po-厂(O), -[a厂(·)/31n(z )]t 。,y - [a 厂(·)/31n( )31n( )]I- 0。

将公式(6)简化为:in( )- ∑fliln z 4-第 4期 李 蓉等:基于超越对数函数的道路交通事故频数预测 51丢壹壹), ln( ln(z,Ca i 1 害 11.3 弹性 系数(7)在计量经济学中,弹性被定义为-个变量的变化对其他变量变化影响的-种测度,即弹性表示为- 个变量改变 1 而导致其他变量变化的百分比比例,弹性常用于检验变量的边际效应[1 .本文中弹性用于测度探索性变量对于道路交通事故频率预测的效果,即探索性变量变化 1 时道路交通事故频数变化的百分比.在路段 i,对于连续性探索变量 ,其道路交通事故频率的弹性系数 定义如下:- · · (8)式中: 表示路段i中探索性变量 的取值;九表示路段i所发生道路交通事故频数均值;醯.表示弹性系数 。

令 - , - ,则dZ Ai- 岛 (9)式中:岛表示探索变量 所对应的回归系数。

超越对数函数模型的弹性系数计算公式如下:- f- Oy- ∑YkjIn . (1o) i-1其中 表示探求性变量 所对应的回归系数,如公式(12)所示 。

1.4 探索性变量选择本文主要 目的不在于探索诸多影响道路安全的探索性变量对事故频数的精确影响效果,而在于为道路交通事故频数预测研究提供-种新的视角和研究方法 .基于此 ,论 文提出了基于超越对数 函数 的道路交通事故频数预测方法 ,并对该方法的有效性和优越性予以实例验证,更偏重的是方法的创新与改进 ,因此本文主要采用单变量模型.由于车流量是影响道路交通安全的主要因素之-,在过去的诸多研究中得到了广泛的研究,加之考虑到事故统计数据库包含详细的路段长度数据,为提高道路交通事故预测的准确性和研究超越对数模型在研究变量之间相互影响关系的优越性,论文增加了路段长度变量.因此本文主要基 于车流量和路段长度两个变量研究基于超越对数函数的道路交通事故频数预测。

1.5 基于超越对数 函数的道路交通事故频数预测在传统的负二项回归方法预测道路交通事故频数的模型中,其对数-线性模型的回归函数方程如下 :in - ·F ·L . (11)式中: 为路段i在时间段t内所发生事故频数均值;F 为路段i在时间段 t内平均车流量;L 为路段i的长度; , , 为待估计的参数值。

超越对数 函数模型的回归函数方程如下 :In po ·(1n F ) ·In L · (1n F ) ·(1n L ) · (In F≈)(In L ). (12)式(12)中各符号代表的意义与公式 (11)-致,岛~ 为待估计的参数值。

以上两种模型的估计效果可通过其拟合优度加以比较判别.本文采用 AkaikeS Information Crite-rion(AIC)方法[1 来比较上述两个模型的拟合优度.作为-种用于测度统计模型拟合优度的标准,某统计模型 AIC值越小则表明其统计拟合优度越好[ 引。

2 实例验证2.1 分析用数据来源本文建立的道路交通事故频次预测模型所分析的样本量须足够大,其分析结果方具较高的可信性。

由于国内有关道路交通事故数据较难获得 ,考虑到数据的准确性和可获取性,本文采用 的分析数据源于加拿大安大略驶通部网站所公布的事故信息系统(Accident Information System)L1 ,主要 包括安大略省 1988年至 2006年的道路交通事故数据 .该信息系统所记录的事故细节信息包括:事故发生地点、具体时间、道路和环境特征、碰捉式、车辆类型、驾驶员状态和人员伤亡等,而汇总信息则包括每个路段的长度 、年平均车流量 、冬季和夏季平均车流量等。

2.2 变量描述性结果根据加拿大安大略省 1988年至 2006年的道路交通事故数据[1 ,所选探索性变量车流量、路段长度和事故频数的描述性统计结果如表 1所示 ,所统计的事故频数分布图则如图 1所示。

2006年选定路段发生事故的频数分布如图 1所示.由图 1可知,在特定的时间区间内发生的事故频数接近于泊松分布,较符合对数分布的样本分布假设条件,因此通过对数回归来预测某-时间区间内的事故频数的期望值是可行的。

52 湖南大学学报(自然科学版)表 1 探索性变量的统计结果Tab.1 Summary statistics of the explosive variable芝籁鐾饕发生事故的次数/(次 ·年 )图 1 2006年选定路段事故频数统计分布图Fig.1 The accident frequency distributionof selected road in 20062.3 回归结果与分析根据所选定的数据,分别采用对数-线性模型和超越对数函数模型进行统计分析,其 回归 系数估计均采 用 专 业 的统 计 分 析 软 件 PASW Statistics19.0,两种模型的回归系数估计结果如表 2所示。

表 2 两种模型 的回归 系数估计结果Tab.2 Estimates of regressive coefficients of the two models变量负二项回归参数估计对数-线性模型 超越对数函数模型岛&佛AIC如表 2所示,通过对比传统的对数-线性模型和超越对数函数回归模型中的估计参数,可知:1)探索性变量对事故频数的影响效果差异明显,两种回归模型系数之间的差异主要缘于其回归方程的链接函数不-致。

2)两种模型的 AIC结果分别为 3.820 8和3.705 2.AIC分析表明:虽然两种模型的拟合优度类似,但是超越对数函数模型较传统的对数-线性模型其拟合优度更好。

图2和图3为所选路段长度分别为 8 km和 1km时,车流量变化对两种模型事故频数预测结果的影响,其中 AADT(Average Annual Daily Traf-tic)表示年平均每日车流量.8 km接近选定路段长度的均值,因此两种模型在该点的取值应该能-定程度上反映其预测的趋势和准确性。

繇辍赫AADT/(车次 ·天- )图 2 路段长度 8 km 处事故频数观测值与预 测值 的对比图Fig.2 The comparison between observed& predictedaccident frequency at 8 km section蓁蕈40。 赫黎 辍 .。 .--口,- 僻l:二 (a-。.[·由图 2和图 3可知:1)相同路段长度处,车流量较小时 ,两种模型的预测结果比较接近 .当车流量逐渐增加时,超越对数模型的增速略大于对数-线性模型,而当车流量增加到-定程度时,对数-线性模型的预测值将大于超越对数函数模型。

2)对于传统的对数-线性模型而言,其高置信区间是当探索性变量取值较低时,该模型准确性较高。

相比于传统的对数-线性模型,探索性变量取值较大时,超越对数函数模型预测精度较高。

整体而言,传统的对数-线性函数模型预测期望变化范围更大 ,在 自变量取值较小 区间有着更好的预测结果 .而当自变量大于-定的界限时,其预测值将明显增加,并将显著偏离实际观测值。

3)相同的车流量条件下,8 km路段发生的道路交通事故频数明显高于 1 km路段发生的道路交通事故频数,但是 8.0 km路段所发生的道路交通事故频数并非 1.0 km路段所发生道路交通事故频数的 8倍 .这说明路段特征和气候环境特征也能影响埘。

豢度.F- l1眷:董第 4期 李 蓉等:基于超越对数函数的道路交通事故频数预测 53事故频数,事故频数和路段长度与道路交通事故之间并非简单 的线性关 系。

AADT即年平均每 日车流量为 5 000时,对数-线性模型和超越对数函数模型对道路交通事故频数预测值随路段长度变化 的趋势 ,如图 4所示。

鼍赫嚣幡图 4 AADT为 5 000时两预测模型 的事故频次预测图Fig.4 The predicted accidents frequencywhile AADT is 5 000由图 4可知:对对数-线性模型而言,在固定车流量的前提下,所预测的事故频数与路段长度成指数关系,这与以往研究结果相符[1。 .相对于对数线性模型,超越对数函数模型在下限边界区间即路段长度较小区间的预测值更大,而在上限边界区间的预测值更保守,这 与基于车流量的预测结果是-致的.而对于对数-线性函数模型,当自变量取值较大时,其预测值偏大。

图 5为 AADT为 1 000时,两种预测模型在不同长度路段时事故频数预测值与实际观测值之间的差异。

路段长度/km图5 车流量 1 000时两预测模型事故频数观 测值 与预 测值 的对比 图Fig.5 The comparison between observed and predictedaccidents frequency while AADT is 1 000由图5可知:所选路段长度小于25 km时,两种模型的拟合效果接近,预测结果的准确度较高 .相对而言,传统的对数-线性模型拟合效果更佳;但是当所选择的路段长度大于35 km时,传统的对数-线性模型预测值会显著偏大,而此时超越对数函数模型的预测值更接近真实观测值.因此当自变量取值较小时,对数-线性模型和超越对数函数模型均有良好的拟合效果;而在预测大样本或者探索性变量变化区间较大时,超越对数函数模型拟合效果明显更优。

构建和应用回归模型中的-个重要问题是估计参数的理解.为了分析和比较两个模型中车流量变动对事故频数预测结果变化的影响,对其进行了弹性分析,其结果如图 6所示.由图6可知:对数-线性函数模型的弹性系数为常数,而超越对数函数模型的弹性是动态变化的.当车流量较大时,超越对数函数模型对应的弹性系数更大 ,可理解为车流量较小时车流量发生 1 的变化与车流量较 大时的车流量发生 1 的变化,其对事故频数的变化影响不同,在大车流量条件下车流量 1 的变化影响更为显著,这与实际情况极为相符。

AADT/(车次 ·天-1)图 6 两种 函数模 型的弹性 系数 对比图Fig.6 The comparison of elasticity betweentWO prediction models图 7为超越对数函数模型的标准差统计图,反映了实际道路交通事故频次观测值与基于超越对数函数的道路交通事故频次预测值统计分布状况.由图 7可知:大部分道路交通事故频次观测值位于基路段长度/km图 7 超越 对数 函数模 型的标 准差统计 图Fig.7 Standard deviation statistics of translog model于超越对数函数的交通事故频次预测值的土3 区间内.统计结果表明:91.43%的事故频次观测值位于该区间内,验证了基于超越对数函数的道路交通峨掣欲∞ 舳 ∞ ∞ ∞ O豢 藉悱赫 衽侨取聪54 湖南大学学报(自然科学版)事故频次预测方法的有效性。

3 结 论本文针对道路交通事故频数预测常见方法--传统对数-线性模型中弹性系数假定为常数,不符合常理且简化了探索性变量之间的相互关系,难以真实反映探索性变量之间的相互影响这两大局限性,将计量经济学广泛应用的超越对数函数引入道路交通事故频数预测中.该模型提供了灵活动态的函数模型,选择探索性变量-路段长度和年平均车流量以预测道路交通事故频数,其弹性系数根据探索性变量的变化而变化。

论文通过运用加拿大安大略省 1988年至 2006年的道路交通事故数据,实例验证了该方法的有效性,并与传统对数-线性模型进行了对比研究。

研究结果表明:超越对数函数模型比传统的对数-线性模型具有更好的拟合优度 .当探索性变量取值相对较小时,对数-线性模型对道路交通事故的预测更为准确;而当探索性变量取值较大时,则超越对数函数模型预测效果更为准确。

除了拟合效果的优势,超越对数函数模型相比于传统的对数-线性模型还具备两个明显的优势:其-,超越对数函数模型采用动态的弹性系数,模型更符合现实;其二,超越对数函数模型应用于道路交通事故频数预测时并无样本须服从泊松分布或者负二项分布的前提条件,使得超越对数函数模型的应用面更为广泛。

另外,有关动态弹性系数模型的研究成果也为道路交通安全改善提供了-种重要的思路:由于弹性系数大的因子对道路交通安全影响更为显著,因此道路交通安全改善应该首先从弹性系数大的因子人手.根据动态弹性系数理论,弹性系数随着交通状况的改变而不断改变,因此其改善的重点和具体措施也应动态变化,如在车流量高峰期和车流量较少的时期,交通管理和改善的重点与手段应该有所差异。

本文研究成果为量化多探索性变量对道路交通事故频数的影响,为道路交通事故预测预防、道路交通安全改进提供了重要的技术支持。

目前国外针对道路交通事故频数的研究正方兴未艾,国内的相关研究由于交通事故数据的准确性和可获取性等原因则相对较少 .下-阶段的工作应该集中于如何通过构建完整的影响道路交通安全的探索性因子的预测模型,探究各种探索性因子对事故损失而不仅仅对事故频数的影响效果,进而识别能改善交通安全状况的关键性和经济性措施 ,识别现有道路中的热点路段,以实现降低道路安全事故、改善道路安全状况的目的。

正在加载...请等待或刷新页面...
发表评论
验证码 验证码加载失败