[发明专利]一种网络文本中交通事件语义角色抽取方法有效
申请号: | 201610381179.9 | 申请日: | 2016-06-01 |
公开(公告)号: | CN107451158B | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 陆锋;张恒才;仇培元;彭澎;余丽 | 申请(专利权)人: | 中国科学院地理科学与资源研究所 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F16/903;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 文本 交通 事件 语义 角色 抽取 方法 | ||
1.一种网络文本中交通事件语义角色抽取方法,其特征在于:其抽取步骤如下:
a、交通事件信息结构定义:
所述交通事件信息结构由事件信息元素及其事件信息角色组成;
所述事件信息元素包括定位元素、类别元素;
所述定位元素包含的事件信息角色有:独立所在道路、非独立所在道路、所在道路附加结构、定位起点、定位起点附加结构、定位终点、定位终点附加结构、全部方向、起始方向、终止方向;
所述类别元素包含的事件信息角色有:事件类型;
b、网络文本数据预处理:
将输入网络文本数据进行数据预处理;
删除网络文本中的重复冗余信息,去掉停留词;
网络文本中文分词,得到分词后词汇序列;
c、交通事件信息角色标注:
采用CRF条件随机场模型对步骤b所得到的词汇序列进行词汇事件角色标注,得到网络文本交通事件角色序列;
d、事件信息角色关系对提取:
将事件信息角色序列中筛选出属于定位元素的事件信息角色,采用SVM支持向量机模型判断筛选出事件信息角色两两之间是否关联,提取出所有可能事件信息角色关系对;
e、交通事件角色关系树构建:
针对步骤d所得到角色关系对,采用算法RoleTreeBuild构建交通事件角色关系树;
f、交通定位信息元素获取:
将步骤e所得到交通事件信息角色关系树抽取交通事件信息定位元素;采用深度优先遍历算法,从所在道路顶点出发,寻找第一个未被访问的邻结点,判断该遍历路径是否包含所在道路,定位起点,定位终点三要素,如果包含,将该路径输出;
g、交通类别信息元素获取:
从步骤c所得到事件信息角色序列中筛选出属于类别信息元素的事件信息角色,将该事件信息角色作为交通事件信息的类别信息元素;
h、交通事件元素关系组合:
将该类别信息元素与步骤d得到的定位信息元素组合成为“定位信息元素-类别信息元素”交通信息元素对;
i、交通事件信息抽取:
针对步骤h得到交通信息元素对集合,组合抽取中的每一个信息元素对,构成一个交通事件信息。
2.根据权利要求1 所述的网络文本中交通事件语义角色抽取方法,其特征在于,所述抽取方法还包括:步骤c中采用CRF条件随机场模型的交通事件信息角色标注方法,并不仅包含CRF条件随机场模型,决策树模型也适用于本专利所保护的交通事件信息角色标注方法;
步骤d中采用SVM支持向量机模型的事件信息角色关系对提取方法,并不仅包括SVM条件随机场模型,隐马尔科夫模型也适用于本专利所保护的事件信息角色关系对提取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院地理科学与资源研究所,未经中国科学院地理科学与资源研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610381179.9/1.html,转载请声明来源钻瓜专利网。