[发明专利]一种网络文本中交通事件语义角色抽取方法有效
申请号: | 201610381179.9 | 申请日: | 2016-06-01 |
公开(公告)号: | CN107451158B | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 陆锋;张恒才;仇培元;彭澎;余丽 | 申请(专利权)人: | 中国科学院地理科学与资源研究所 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F16/903;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 文本 交通 事件 语义 角色 抽取 方法 | ||
本发明公开了一种网络文本中交通事件语义角色抽取方法,如图1所示,抽取步骤为:交通事件信息结构定义、网络文本数据预处理、交通事件信息角色标注、事件信息角色关系对提取、交通事件角色关系树构建、交通定位信息元素获取、交通类别信息元素获取、交通事件元素关系组合、交通事件信息抽取。本发明以开放互联网网络文本作为交通事件信息实时数据源,利用其更新速度快、参与人数多、用户分布广泛的特点,提出一种网络文本中交通事件语义角色抽取方法,为传统的交通信息采集手段提供有效补充。
技术领域
本发明涉及一种交通事件语义角色的抽取方法,尤其涉及一种网络文本中交通事件语义角色抽取方法。
背景技术
网络文本:指来源于多种形式的互联网网页文本,包括论坛、博客、社区、微博、微信等文本资料,互联网是整个全社会、多领域、广纵深、近实时的动态映像,巨大的互联网信息源是公众获取信息的主要渠道,据统计,截止2014年12月可索引的互联网网页数量为43.6亿页面。
交通事件:车辆在道路上因过错或者意外造成人身伤亡或者财产损失的事件。不仅是由不特定的人员违反交通管理法规造成的;也可以是由于地震、台风、山洪、雷击等不可抗拒的自然灾害造成。
语义角色标注:是自然语言处理的一种浅层语义分析实现方式,优点是问题定义清晰,便于人工标注评测。该方法不对整个句子进行详细的语义分析,而只是标注句子中的某些短语的语义角色,例如“委员会明天将要通过此议案”在中文语义角色标注语料库资源Chinese PropBank(CFB)中会做如下标识:“委员会”的语义角色为Arg0,其含义是表示动作的施事;“此议案”的语义角色标注为Arg1,其含义是表示动作的影响;“明天”的语义表色标注为ArgM-TMP,其含义是表示时间。以上的语义角色Arg1、Arg0、ArgM-TMP都是在CFB资源中预先定义的语义角色。
交通信息获取技术是智能交通系统(ITS)的核心研究内容,也是建设智能交通系统与进行交通管理的基础。快速、高效、准确、全面获取交通信息能够提高交通系统整体运行效率,降低交通拥堵发生次数,保障交通安全,提高交通管理服务水平。交通信息主要包括道路交通流、道路路况、交通限制、交通管制、交通事件、施工作业、道路障碍、交通天气与路面环境等信息。
目前交通信息获取手段主要包含以下四种:
1、固定传感器交通信息获取技术(感应线圈、视频监控、红外探测及微波探测等),该获取方式主要在城市交通发展的早期阶段,主要依赖大面积部署在道路上的交通信息监测设备,但是这种方式成本太高,设备更换与维护都比较耗时耗力。且这种方式只能获取道路的断面流量数据,数据的处理周期慢,且获取的整体交通信息不全。目前,该方式主要应用于监控城市重要道路、关键断面布设。
2、浮动车交通信息获取技术,该方式是目前交通信息获取方面最为成熟的技术,也是商用化最好的信息获取手段。该方式主要依赖于安装有定位设备(如GPS、北斗等)的车辆实时的位置回传,车辆类型主要包括出租车、公交车、两客一危车辆等。服务器端实时将回传的位置数据进行地图匹配、速度提取等分析处理操作,获取到路段的实时的交通信息。该获取方式的优点一方面是采集的交通信息覆盖度较高,可以获取整个城市的主要的城市道路网,另一方面,实时性较好,可以及时了解城市的交通状态,此外,与固定传感器相比,设备维护简单、便利,费用较低。
3、手机信令分析交通信息获取技术,该获取方式可以充分利用海量用户的手机位置资源,但是对数据处理技术要求很高,且手机数据获取存在隐私泄露的风险。该技术的优点在于全天候、覆盖范围广、低成本,而且能够探测到浮动车技术采集不到的郊区小路的实时交通信息。
4、车联网环境下交通信息获取技术,车联网以车内网、车际网以及车载移动互联网为基础,实现车-车,车-互联网无线通信与交换,通过感知融合车辆网相关信息,可以实现交通信息的获取,但目前车辆网的相关实施处在起步阶段,距离成熟商用还有一定的距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院地理科学与资源研究所,未经中国科学院地理科学与资源研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610381179.9/2.html,转载请声明来源钻瓜专利网。