[发明专利]基于聚类的城市基础设施突发事件的检测方法有效
申请号: | 201410525969.0 | 申请日: | 2014-10-08 |
公开(公告)号: | CN104299182B | 公开(公告)日: | 2017-12-19 |
发明(设计)人: | 张加万;许冰晗;鄂艳丽;赵雅慧;孙丽婷;马婧 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/26 |
代理公司: | 天津市北洋有限责任专利代理事务所12201 | 代理人: | 李丽萍 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 城市基础设施 突发事件 检测 方法 | ||
1.一种基于聚类的城市基础设施突发事件的检测方法,其特征在于:
步骤一、利用城市管理服务热线系统接收市民反映城市基础设施问题的电话,然后,将该电话内容记录到一工单数据库中,所述工单数据库至少包括以下内容:
工单编号、接收工单的时间、工单反映的问题所涉及到的城市基础设施的类别、描述该电话所反映的城市基础设施问题的文本和该电话所反映的城市基础设施问题的地址;其中,所述工单反映的问题所涉及到的城市基础设施的类别包括供热、自来水、燃气和排水,城市基础设施问题的地址是层级的;
步骤二、根据接收工单的时间和工单反映的问题所涉及到的城市基础设施的类别对工单数据库进行筛选;
使用中文分词技术对所筛选出的工单提取工单描述的电话所反映的城市基础设施问题的文本中的语义关键词,所述语义关键词是城市基础设施问题的原因或结果的词语;整理对应的语义关键词间的因果关系,用于定义城市基础设施突发事件在语义内容这一维度上的种类;
使用中文分词技术对所筛选出的工单提取工单所反映的城市基础设施问题的地址中的地址关键词,从而提取出工单所反映的城市基础设施问题的地址的每个层级的地址单元;
步骤三、对步骤二处理后的工单进行语义聚类:
根据工单的语义关键词的提取统计信息和整理的语义关键词间的因果关系把工单归到匹配的城市基础设施突发事件语义种类中,从而得到在语义层面上的聚类,包括:
如果工单反映的城市基础设施问题的文本中包括步骤二确定的某种反映城市基础设施突发事件的原因的语义关键词,则将该工单归到这种城市基础设施突发事件中;
如果工单反映的城市基础设施问题的文本中同时出现了多个反映不同类别的城市基础设施突发事件的原因的语义关键词,则将该工单归到这些城市基础设施突发事件中含有反映城市基础设施突发事件的结果的语义关键词最多的城市基础设施突发事件中;
如果工单反映的城市基础设施问题的文本中只出现了反映城市基础设施突发事件的结果的语义关键词X,则在该工单的接收时间的前后2天内找在语义上出现了和上述结果的语义关键词有因果关系的原因的语义关键词的工单,
如果找到的符合条件的工单已经归到相应的城市基础设施突发事件中,则把该工单也归到这种城市基础设施突发事件中;
如果没有找到符合条件的工单,则把该工单归到包含结果的语义关键词X的城市基础设施突发事件,且该城市基础设施突发事件是所有包含结果的语义关键词X的城市基础设施突发事件中优先级最高的城市基础设施突发事件;城市基础设施突发事件的优先级是规定城市基础设施突发事件发生后需要做出反应并解决的紧急程度;
如果工单反映的城市基础设施问题的文本中没有任何反映城市基础设施突发事件的原因或结果的语义关键词,则该条工单在语义上不属于任何城市基础设施突发事件;
步骤四、对步骤三中得到的语义层面上的每个聚类进行空间聚类,从而得到在空间层面上的聚类:
遍历每个聚类中的工单,判断聚类中有相同的地址关键词的工单的个数是否大于等于3,
当聚类中有相同的地址关键词的工单的个数大于等于3时,则初步认定这些工单的集合成为一个城市基础设施突发事件;
当聚类中有相同的地址关键词的工单的个数小于3时,定义一个最大经纬度距离D,遍历该聚类中的所有工单,如果两条工单的经纬度距离d大于0而小于等于D,则把它们归为一个空间层面上的聚类;
遍历后,要求空间层面上的聚类包含的工单的个数大于等于3;否则,舍弃这样的空间层面上的聚类;
步骤五、对步骤四中得到的空间层面上的每个聚类进行时间聚类,从而得到在时间层面上的聚类:
设定时间聚类中最大的时间尺度为5天,空间层面上的每个聚类中的工单可能在同一天或者相邻的天数内被接收,统计空间层面上的每个聚类中的所有工单的被接收的时间,得到所有的日期、每个日期对应的出现的次数和接收时间是该日期的所有工单的集合;按照日期出现的次数从大到小对日期排序后得到日期的集合F,遍历日期的集合F的每个日期Y,
如果日期的集合F中,存在与日期Y相差前后2天内的日期Z,则将空间层面上的聚类中接收时间在日期Y和Z的工单聚在一起,并从日期的集合F将日期Y和日期Z删除;
如果日期的集合F中,不存在与日期Y相差前后2天内的日期,则遍历日期的集合F中的下一个日期;
遍历后,得到在时间层面上的聚类,要求它们包含的工单的个数大于等于3;否则,舍弃这样的时间层面上的聚类;
步骤六、认定步骤五中得到的时间层面上的聚类是城市基础设施突发事件,用城市基础设施突发事件的根节点的可视设计方案在地图上展示这些城市基础设施突发事件的分布,即以突发事件根节点为圆心画一个圆,突发事件根节点的圆圈的不透明度和突发事件中的工单的个数成正比,突发事件根节点的圆圈的灰度反映了突发事件的语义种类,突发事件根节点的圆圈的半径和突发事件的影响范围成正比,从而检测出城市基础设施突发事件;所述的城市基础设施突发事件的根节点,是指城市基础设施突发事件中的第一个所反映的城市基础设施问题的文本包含反映城市基础设施突发事件原因或结果的语义关键词的工单。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410525969.0/1.html,转载请声明来源钻瓜专利网。