[发明专利]事件本体构建方法有效
申请号: | 201610470527.X | 申请日: | 2016-06-25 |
公开(公告)号: | CN106445990B | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 刘宗田;张亚军;李强;周文 | 申请(专利权)人: | 上海大学;上海市科技企业联合会 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种事件本体构建方法。本方法主要包括以下几个步骤:(1)获取相关领域的文档,(2)构建CEC语料库,(3)通过学习语料库,从文本中抽取事件以及事件各要素,(4)事件类分类以及非分类关系的抽取,(5)从归纳得到的事件类、事件类要素、事件类关系,抽象得到其形式化的描述语言,(6)实现基于事件本体的事件分类关系推理。本发明克服传统本体难以表示动态知识的缺陷,不仅适合于表示静态知识,而且适合于表示动态知识,降低本体中非分类关系的繁杂性,为计算文本语义提供了有效的支持。 | ||
搜索关键词: | 事件 本体 构建 方法 | ||
【主权项】:
1.事件本体构建方法,根据事件本体体系结构特点,概括事件本体的构建方法包括以下几个步骤:(1)获取相关领域的文档,(2)构建CEC语料库,(3)通过学习语料库,从文本中抽取事件以及事件各要素,(4)事件类分类以及非分类关系的抽取,(5)从归纳得到的事件类、事件类要素、事件类关系,抽象得到其形式化的描述语言;(6)实现基于事件本体的事件分类关系推理;所述步骤(1)获取相关领域的文档的步骤如下:(1‑1).选择中文突发事件领域的新闻文本作为研究内容;(1‑2).通过人工的方式在网站挑选上述领域的新闻文本;(1‑3).去除相关HTML文本中的标记,只保留标题和正文内容,并且用XML格式进行描述;所述步骤(2)构建CEC语料库的步骤如下:(2‑1).通过语义智能实验室开发的事件本体语料标注工具Event Annotator对领域文档进行半自动标注;(2‑2).通过与相关领域专家进行合作,对半自动标注的文档进行手工调整,最终形成专业性的标注文档;(2‑3).将标注好的文档汇总形成CEC语料库;所述步骤(3)通过学习语料库,从文本中抽取事件以及事件各要素的步骤如下:(3‑1).对标注的语料中的事件以及各要素的特征进行统计分析,这些特征包括单词特征、构词特征、关键词特征、上下文特征、词性特征、词典特征、语法特征、位置特征、词频特征、语义特征;(3‑2).通过统计结果构建事件以及相关要素的特征映射表,表的键为要素字符,值为二进制特征向量;(3‑3).通过对训练语料中的事件以及相关要素进行深度学习分类训练,生成稳定的识别网络,最后对测试语料中文档中的事件及其要素进行识别;(3‑4).根据事件及相关要素的定义,对识别结果进行人工修改;所述步骤(4)事件类分类以及非分类关系的抽取的步骤如下:(4‑1).给出事件类关系作出详细的定义;(4‑2).分类关系:两个事件类,如果它们外延存在包含关系,则它们的内涵必定存在反向包含关系;它们之间存在继承关系,又称分类关系;外延大的是被继承者,称为父类,小的是继承者,称为子类;(4‑3).事件之间存在许多类非分类关系,定义如下表所示:表1:事件非分类关系(4‑4).根据事件类的分类以及非分类关系的定义,制定事件关系的抽取规则,并且实现自动化的抽取及标注;(4‑5).通过人工的方式对自动标注的结果进行更正,并对所有的事件关系的标注展开专家座谈讨论,确定最终的抽取结果;所述步骤(5)从归纳得到的事件类、事件类要素、事件类关系,抽象得到其形式化的描述语言的步骤如下:(5‑1).通过对现有的形式化语言如描述逻辑、Z语言进行综合分析,最终确定使用描述逻辑作为事件本体的形式化描述基础;(5‑2).通过定义事件本体的关键字将基于语义文本描述的事件相关要素转为基于关键字描述;(5‑3).对已有语料中的事件类、事件要素和事件关系进行形式化描述,并且以XML文档的格式存入事件本体中;所述步骤(6)实现基于事件本体的事件分类关系推理的步骤如下:(6‑1).首先需要对事件本体中的基于XML描述的候选事件及其要素进行形式化的描述,形式化的描述语言EO‑SROIQ;(6‑2).两个事件之间是否为分类关系,通过基于Tableau算法的实例检测在事件本体中找到相关的事件类,并通过事件类之间的关系进行推理,如果两者在事件本体中找到对应的事件类,那么两者之间的事件关系就用事件本体中的事件类之间关系表示;(6‑3).如果两个事件类之间没有在事件本体中有对应的事件类,那么就需要通过事件要素来综合分析两者之间是否有分类关系;在同领域的不同事件中,事件的要素在事件中的权重相同;但同一个事件中,不同的要素权重不同,通过对相关元素之间的关系进行分析,综合给出事件关系的评价,从而判断两个事件的分类关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学;上海市科技企业联合会,未经上海大学;上海市科技企业联合会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610470527.X/,转载请声明来源钻瓜专利网。