[发明专利]一种面向大坝安全运行的事件图谱构建方法有效
申请号: | 202110702542.3 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113312500B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 毛莺池;季佳丽;肖海斌;程永;苏茂;吴威;王龙宝;陈豪;简树明;丁玉江;谭彬;张润;刘锦;岳宏斌;赵盛杰;熊成龙;沈凤群;冉龙明;娄毅博;李旭 | 申请(专利权)人: | 河海大学;华能澜沧江水电股份有限公司;华能集团技术创新中心有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/211;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李玉平 |
地址: | 211100 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 大坝 安全 运行 事件 图谱 构建 方法 | ||
本发明公开一种面向大坝安全运行的事件图谱构建方法,步骤为:(1)使用词向量嵌入增强语义信息;(2)引入局部注意力,全局注意力捕获关键词和挖掘文档信息;(3)使用Focalloss解决样本不均衡问题并提取事件类型;(4)增加事件类型编码串联组成新的句子编码,使用BiLSTM处理串联后的嵌入向量;(5)按比例融合图转换注意网络和注意力网络提取有效特征,捕获对应事件论元;(6)使用论元填充网络填补事件缺失文档级论元;(7)加权融合图转换注意网络和注意力网络标注序列,获取事件之间的因果关系,构建事件图谱。
技术领域
本发明涉及一种面向大坝安全运行的事件图谱构建方法,通过基于双重注意力的事件检测与抽取模型提取文本数据中的大坝运行工况事件及其事件论元,构成事件知识图谱。旨在解决从大量的大坝运行记录文本种自动化地提取事件及其论元,生成大坝事件知识图谱。
背景技术
知识图谱的概念由Google于2012年提出,最早被搜索引擎用于基于实体的搜索来代替基于字符串的搜索,从而提升用户搜索质量与体验。在大数据时代,知识图谱以结构化的形式将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。
在大数据时代,手工劳动已经不能适应知识图谱的构建需求。不少企业开始积极探索和尝试自动化构建技术,利用机器从不同来源、不同结构的数据中进行抽取,形成知识存入到知识图谱。而在产业实践中,通过文本信息等非结构化数据中提炼知识构建知识图谱,技术上面临很多挑战。
事件关系抽取相较于实体关系抽取,需要判断两个事件之间的关系,而事件在文本中的描述通常比较复杂,有可能是一句话或者多句话,因此,建立以事件为中心的知识图谱难度相比实体知识图谱难度更大。
发明内容
发明目的:针对现有技术中存在的难题,本发明提供一种面向大坝安全运行的事件图谱构建方法,以构建一个以大坝安全运行事件为中心的图谱,以面向大坝安全运行的事件为中心的图谱更能体现事件之间的因果、时序关系,提升大坝管理人员应对未来紧急事件的能力。
技术方案:一种面向大坝安全运行的事件图谱构建方法,包括如下步骤:
(1)使用ALBERT嵌入层将包含大坝安全运行事件信息的句子和文档转化为特征向量,增强中文的语义信息,并使用BiLSTM处理每个词转换成的特征向量。
(2)引入局部注意力模拟事件触发器,按重要性程度分配每个单词相应权值,取最高权重值单词为隐藏事件触发器,引入全局注意力学习句中关键词和文档语境信息,获得触发器在该场景下唯一含义,辅助判断该句子的事件类型。
(3)训练无触发器的事件检测模型,在无触发器的事件检测模型的训练过程中采用Focal loss作为损失函数,在解决样本不均衡问题的同时加强正样本和难分样本对模型的影响力,输出预测事件类型。
(4)在特征向量后串联事件类型编码向量,组成新的句子编码,通过BiLSTM处理串联后的嵌入向量,捕获上下文信息。
(5)根据依存句法分析生成的句子结构和BiLSTM生成的语义向量,引入注意力模式按权重融合图转换网络层和注意力网络层提取的特征,生成新的表示向量,通过BIO序列标注方式抽取事件论元。
(6)采用TextCNN判断关键句中的关键事件,然后利用相邻句子中的填充词来补充缺失的事件角色实现事件的缺失论元提取,补充事件知识图谱。
(7)加权融合图转换注意网络和注意力网络用以标注序列,获取事件之间的因果关系,构建事件图谱。
进一步的,所述步骤(1)中使用ALBERT嵌入层将包含大坝安全运行事件信息的句子和文档转化为特征向量,增强中文的语义信息,并使用BiLSTM处理每个词转换成的特征向量的具体步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学;华能澜沧江水电股份有限公司;华能集团技术创新中心有限公司,未经河海大学;华能澜沧江水电股份有限公司;华能集团技术创新中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110702542.3/2.html,转载请声明来源钻瓜专利网。