[发明专利]基于负二项回归的水上交通事故调查分析和预测方法无效
申请号: | 201010549146.3 | 申请日: | 2010-11-18 |
公开(公告)号: | CN102103715A | 公开(公告)日: | 2011-06-22 |
发明(设计)人: | 张浩;肖英杰;白响恩;杨小军;李松;郑剑 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06Q10/00 | 分类号: | G06Q10/00;G06Q50/00 |
代理公司: | 上海天翔知识产权代理有限公司 31224 | 代理人: | 陈逸良 |
地址: | 200135 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于负二项回归的水上交通事故调查分析和预测方法,首先确定可能影响事故发生的最为基本和最为重要的因素,确定若干个相互独立的变量并根据数据的特征选择合适的模型类型,然后在此基础上进行模型假设,确定描述问题的基本模型,最后通过一系列准则下对模型进行参数估计、验证,对模型进行修正,建立更准确的模型。本发明的分析预测模型,具有较好预测精度,为水上交通事故的分析预测提供了一种好的方法。 | ||
搜索关键词: | 基于 负二项 回归 水上 交通事故 调查 分析 预测 方法 | ||
【主权项】:
1.基于负二项回归的水上交通事故调查分析和预测方法,按如下步骤进行:a)变量和数据选择:在建模之前进行一系列描述性的统计和相关分析,确定可能影响事故发生的最为基本和最为重要的因素,最终确定可以进入模型的若干个相互独立的变量;根据因变量和自变量的特点选择合适的模型类型,当因变量为计数变量,即取事件发生的数目时,考虑使用计数(Count Data)模型;b)模型假设:定性变量的常见分布类型有二项分布、多项分布、Poisson分布、负二项分布等;由于事故起数、死亡和失踪人数、受伤人数是任意非负整数,是典型的计数数据,不服从正态分布,而可能是服从泊松分布或负二项分布,所以在计量分析时采用计数模型比线性模型更适合,假定被解释变量的离散取值服从某种泊松分布,其分布函数为:P ( Y = y i ) = exp ( - λ ) λ y i y i ! , ]]> yi=1,2,3,Λ其中E(yi)=λ,Var(yi)=λ,即随机变量y的均值与方差均为λ,若以X=(x1,x2,Λ,xm)表示影响λ的m个自变量,泊松回归模型就是描述服从泊松分布的目标变量y的均值λ与解释变量X之间关系的回归模型,可以表示为:logλ=Xβ其中β为待估计的参数,它可以采用迭代非线性加权最小二乘法或极大似然法来来估算,在给定xi的条件下,yi的条件密度就是:f ( y i | x i , β ) = e - λ ( x i , β ) λ ( x i , β ) y i y i ! ]]> 如果随机变量yi的均值等于方差,那么泊松最大似然估计就是一致和有效的,而实际上的事故次数数据往往具有过离散(over-dispersion)特征,如果随机变量yi过度发散,方差大于均值,即方差大于均值,在这些情况下,如果仍然使用泊松回归模型,可能会低估参数的标准误差,高估其显著性水平,从而在模型中保留多余的解释变量,最终导致不合理的结果,为消除这种不利影响,使用负二项回归模型(Negative Binomial Regression)来代替泊松回归模型进行估计,通过引入伽马分布的误差项构建负二项分布,负二项回归模型在条件均值μ中引入了一个独立的随机效应u,从而扩展了泊松回归模型,即:logμi=logλi+logui,则负二项回归模型的回归形式为:logμi=xiβ+ei上式中,ei为随机误差,exp(ei)服从Γ分布,在负二项回归模型中,yi对xi,ui的条件分布仍为泊松分布:f ( y i | x i , u i ) = [ exp ( - λ i u i ) ( λ i u i ) y i ] / y i ! ]]> 此时,随机变量yi的条件均值和方差分别为λ,λ(1+η2λ),其中η2=1/yi,是对条件方差超出条件均值程度即发散程度的衡量;c)参数估计和验证:1)用拟极大似然函数法(QML)进行参数估计:拟极大似然函数法是在一系列分布假定下才能实现,它的估计比较稳健,即使分布指定错误也能产生正确定义条件均值参数的一致估计,结果的这种稳健性类似于普通回归:即使残差分布非正态,ML估计也是一致的,普通最小二乘法中,一致性要求是条件均值m(x,β)=x′β,而在QML中,一致性要求有m(x,β)=exp(x′β);2)参数估计检验:离散数据计数模型的参数估计是通过极大似然估计实现的,估计参数的检验主要通过Wald检验来完成,参数检验有助于对抽样总体的均值做出一些推断,Wald检验类似于线性回归模型中的t检验,因此常被称为广义t检验,Wald检验的假设为:H0:βj=0,建立t统计量为:t β j = β ^ j se ( β ^ j ) ]]> 其中,为所要检验的参数估计值,为一列参数估计值的标准差,t统计量在大样本的情况下近似服从标准正态分布,根据模型估计结果进行参数估计值的t检验,若t检验显著,则保留,否则剔除该变量,不断重复该过程直到加入所有显著的变量;3)按如下准则进行模型的拟合优度校准、验证和变量的引入判别:(1)Pesudo R2统计量对模型进行拟合优度检验,R2值较大说明拟合得较好;(2)Log likelihood(LL)对数极大似然函数值是基于极大似然估计得到的统计量,对数似然值用于说明模型的精确性,越大说明模型越精确;(3)t估计参数的显著性在5%水平;(4)Pearson卡方值和自由度的比值在0.8-1.2之间;(5)Akaike’s information criteria(AIC)准则,用于评价模型的好坏,一般要求AIC值越小越好。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010549146.3/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理