[发明专利]一种事理图谱在线扩展方法及装置有效
申请号: | 202110217425.8 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112948552B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 赵刚;杨昊;王兴芬 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/36 |
代理公司: | 北京天方智力知识产权代理事务所(普通合伙) 11719 | 代理人: | 路远 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事理 图谱 在线 扩展 方法 装置 | ||
本发明公开了一种事理图谱在线扩展方法及装置,该方法包括以下步骤:获取历史新闻文本数据,构建事理图谱;获取最新新闻文本数据,对最新新闻文本数据进行事件关系的匹配及事件抽取;基于自适应泛化模型,利用抽取到的最新新闻文本数据的前件事件和后件事件,对构建的事理图谱进行在线扩展。该方法降低了人工成本,提高了扩展效率,增强了事理图谱的可移植性。
技术领域
本发明涉及事理图谱在线扩展技术领域,特别地涉及一种基于自适应泛化模型的事理图谱在线扩展方法及装置。
背景技术
事理图谱是继知识图谱之后,以(前件事件,关系,后件事件)作为三元组所形成的事理知识库。与知识图谱所不同,事理图谱能够描绘出事件之间的演化规律和模式,可以应用于基于事理的问答,事件预测等。现有的事理图谱的构造方式都是基于大数据直接生成,实则为静态事理图谱。
现有的事理图谱的生成方法为:事件关系抽取,事件的抽取,事件泛化,可视化。在事理图谱的在线扩展方面研究尤其罕见。在事件泛化上,现有的技术主要分为有监督学习和无监督学习两种方式:其中有监督学习为利用提前标注好的事件种子集作为训练集,通过特征提取配合深度学习进行分类任务,完成事件泛化。无监督学习主要是利用基于K-means的改良,利用欧式距离进行聚类。
上述的利用有监督的方式进行事件泛化,其需要大量的训练样本集,目前并无完善统一的训练样本,故需要根据自身需求花费大量人力资源,进行标注,并且深度学习模型的训练时长较长,需要很高的时间成本。
上述的无监督事件泛化的方式虽然降低了人力要求,但是依旧无法在线扩展节点,只能生成特定领域的静态事理图谱,可移植性,可扩展性差,不能够识别未知事件,仅能根据先验知识进行手工扩展。
发明内容
有鉴于此,本发明提出一种基于自适应泛化模型的事理图谱在线扩展方法及装置,降低了人工成本,提高了扩展效率,增强了事理图谱的可移植性。
本发明第一方面提供一种事理图谱在线扩展方法,该方法包括以下步骤:
获取历史新闻文本数据,构建事理图谱;
获取最新新闻文本数据,对最新新闻文本数据进行事件关系的匹配及事件抽取;
基于自适应泛化模型,利用抽取到的最新新闻文本数据的前件事件和后件事件,对构建的事理图谱进行在线扩展。
进一步地,所述事理图谱的构建方法为:
利用事件关系规则,构建因果事件规则库,根据因果事件规则库中事件关系规则,对历史新闻文本数据进行事件关系匹配,提取出历史新闻文本数据的前件和后件;
对提取出的历史新闻文本数据的前件和后件进行分词,抽取历史新闻文本数据的前件和后件中的事件,形成历史新闻文本数据的三元组;
基于事件泛化的聚类方法和自适应泛化模型,对历史新闻文本数据的三元组中前件事件和后件事件进行泛化,初步形成事理图谱,并保存自适应泛化模型中事理图谱的记忆权值。
进一步地,所述对构建的事理图谱进行在线扩展的步骤包括:
将最新新闻文本数据的前件事件和后件事件进行向量化表示,并输入自适应泛化模型;
根据自适应泛化模型中事理图谱的记忆权值,计算得到最新新闻文本数据的前件事件和后件事件的竞争获胜者,并分别计算竞争获胜者与输入事件的相似度,将相似度与设定的阈值进行比较;
若最新新闻文本数据的前件事件和后件事件中至少一个事件的所有获胜者相似度均小于设定的阈值,利用最新新闻文本数据的前件事件和/或后件事件激活自适应泛化模型中新的计算单元,并根据计算单元所指类别中动词和名词出现的频率,人工标注新事件节点标签,生成新的事件边;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110217425.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种空间机器人用关节可靠性验证方法
- 下一篇:空调控制方法、装置及空调机组