[发明专利]一种面向大坝安全运行的事件图谱构建方法有效
申请号: | 202110702542.3 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113312500B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 毛莺池;季佳丽;肖海斌;程永;苏茂;吴威;王龙宝;陈豪;简树明;丁玉江;谭彬;张润;刘锦;岳宏斌;赵盛杰;熊成龙;沈凤群;冉龙明;娄毅博;李旭 | 申请(专利权)人: | 河海大学;华能澜沧江水电股份有限公司;华能集团技术创新中心有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/211;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李玉平 |
地址: | 211100 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 大坝 安全 运行 事件 图谱 构建 方法 | ||
1.一种面向大坝安全运行的事件图谱构建方法,其特征在于,包括如下步骤:
(1)使用ALBERT嵌入层将包含大坝安全运行事件信息的句子和文档转化为特征向量,增强中文的语义信息,并使用BiLSTM处理每个词转换成的特征向量;
(2)引入局部注意力模拟事件触发器,按重要性程度分配每个单词相应权值,取最高权重值单词为隐藏事件触发器,引入全局注意力学习句中关键词和文档语境信息,获得触发器在当前场景下唯一含义,辅助判断该句子的事件类型;
(3)在模型训练过程中采用Focal loss作为损失函数,在解决样本不均衡问题的同时加强正样本和难分样本对模型的影响力,输出预测事件类型;
(4)在特征向量后串联事件类型编码向量,组成新的句子编码,通过BiLSTM处理串联后的嵌入向量,捕获上下文信息;
(5)根据依存句法分析生成的句子结构和BiLSTM生成的语义向量,引入注意力模式按权重融合图转换网络层和注意力网络层提取的特征,生成新的表示向量,通过BIO序列标注方式抽取事件论元;
(6)采用TextCNN判断关键句中的关键事件,然后利用相邻句子中的填充词来补充缺失的事件角色实现事件的缺失论元提取,补充事件知识图谱;
(7)加权融合图转换注意网络和注意力网络用以标注序列,获取事件之间的因果关系,构建事件图谱。
2.根据权利要求1所述的面向大坝安全运行的事件图谱构建方法,其特征在于,所述步骤(1)中使用ALBERT嵌入层将包含大坝安全运行事件信息的句子和文档转化为特征向量,增强中文的语义信息,并使用BiLSTM处理每个词转换成的特征向量的具体步骤如下:
(1.1)以大坝日常工况与应急工况下的设备运行记录为微调训练语料库,之后在已经完成预训练的ALBERT模型上进行微调训练,将句子转换成数学形式的特征向量W;
(1.2)使用BiLSTM网络处理句子特征向量W,输出两个隐藏状态和合成为用LSTM输出向量h来表示句子上下文信息。
3.根据权利要求2所述的面向大坝安全运行的事件图谱构建方法,其特征在于,所述步骤(2)中引入局部注意力模拟事件触发器,按重要性程度分配每个单词相应权值,取最高权重值单词为隐藏事件触发器,引入全局注意力学习句中关键词和文档语境信息,获得触发器在该场景下唯一含义,辅助判断该句子的事件类型的具体步骤如下:
(2.1)引入局部注意力机制,将LSTM输出向量h,事件类型特征向量t1作为输入,使用公式获得局部注意力向量αs,其中hk是输出向量h中第k个部分,是局部注意力向量αs中第k个部分;
(2.2)引入全局注意力机制,将输出向量h、事件类型嵌入向量t2和文档级嵌入向量d三部分作为输入,使用公式计算全局注意力嵌入向量αd,其中hk是输出向量h中第k个部分,是全局注意力向量αd中第k个部分;
(2.3)对αs和t1使用点积操作,生成vs捕获局部特征和模拟隐藏的事件触发器,对αd和t2使用点积操作,生成vd捕获全局特征和语境信息,之后使用Sigmoid函数o=σ(λ·vs+(1-λ)·vd)处理加权平均后的双重注意力向量vs和vd,λ∈[0,1]是在vs和vd之间进行权衡的超参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学;华能澜沧江水电股份有限公司;华能集团技术创新中心有限公司,未经河海大学;华能澜沧江水电股份有限公司;华能集团技术创新中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110702542.3/1.html,转载请声明来源钻瓜专利网。