[发明专利]一种用于矛盾纠纷事件因果关系识别的深度学习方法有效
申请号: | 201911144453.0 | 申请日: | 2019-11-20 |
公开(公告)号: | CN111709244B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 钱华;姜永华;钱建华;王巧荣;房查;张宏斌 | 申请(专利权)人: | 中共南通市委政法委员会;江苏飞搏软件股份有限公司 |
主分类号: | G06N3/0455 | 分类号: | G06N3/0455;G06N3/08;G06N5/025;G06F40/30;G06Q50/18 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 周新亚 |
地址: | 226000 江苏省南通市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 矛盾 纠纷 事件 因果关系 识别 深度 学习方法 | ||
1.一种用于矛盾纠纷事件因果关系识别的深度学习方法,其特征在于,所述方法包括以下步骤:
步骤1:获取训练语料文本;
步骤2:训练语料文本预处理,输出从M个事件描述文本中提取的M个包含2个因果关系、15个上下文非因果关系句子的句子数组;
步骤3:自动标注提取的每个句子数组,输出标注后的M个包含1个结果句子、1个原因句子和15随机句子的句子数组;
步骤4:训练基于上下文注意力机制的因果关系识别模型;
步骤5:待识别的矛盾纠纷事件描述文本预处理,输出对应的句子的语义特征向量;
步骤6:将语义特征向量组合后输入训练好的因果关系识别模型中;
步骤7:输出矛盾纠纷事件间的因果关系;
步骤1中获取训练语料文本过程如下:
1-1利用网络爬虫工具,从政务微博、重大新闻网站、政府网站等多源网页中采集事件文本数据,形成初始事件文本库;
1-2从多源业务数据库中采集矛盾纠纷大数据,形成矛盾纠纷事件分析库;
1-3对初始事件文本库中的数据和分析库中的矛盾纠纷事件数据进行清洗,
提取出矛盾纠纷事件描述文本,形成训练语料文本;
所述步骤2中所述的训练语料文本的预处理过程如下:
2-1标注训练语料文本中每个矛盾纠纷事件描述文本中的因果关系连接词;
2-2根据因果关系连接词,从M个事件描述文本中提取的M个包含2个因果关系、15个上下文非因果关系句子的句子数组;
所述步骤3具体为:通过自动化标注程序,对从M个矛盾纠纷事件描述文本中提取的M个句子数组进行标注,输出M个包含1个结果句子、1个原因句子和15随机句子的句子数组;
步骤4中训练基于上下文注意力机制的因果关系识别模型,具体实现如下:4-1将标注后的M个句子数组分成两部分,随机选取75%保留因果连接词,25%删去因果关系连接词;
4-2特征向量提取,基于BERT语义编码模型对步骤(3)中输出的每个句子数组中的每个句子进行语义特征编码,输出768维的语义特征向量;
4-3选取任意一个句子数组,将任意一个句子数组中的1个结果句子分别与1个原因句子、15个随机句子两两组成16个1536维的向量Xi;
向量Xi表示为:
Xi=concat(Q|Ki);
其中,Q为结果句子的语义特征向量,Ki为原因句子或者随机句子的语义特征向量,i取值范围为从1到16;
4-4构建权重值计算网络;
4-5将向量Xi输入到权重值计算网络中,计算得出结果句子与随机句子、原因句子的因果关系权重值Vi;
因果关系权重值Vi计算公式为:
Vi=c(tanh(aXi));
其中,a为输入层和隐藏层连接得到的权重参数,c为隐藏层和输出层连接得到的权重参数,i取值范围为从1到16;
4-6利用softmax对步骤4-4计算得出的因果关系注意力向量V进行归一化处理,输出最终的注意力向量V′;
4-7依次选取剩余的任意一个句子数组,将选取的任意一个句子数组中的1个结果句子分别与1个原因句子、15个随机句子两两组成1536维的向量Xi;
4-8重复步骤(4-4)和步骤(4-5),直至遍历全部句子数组。
2.根据权利要求1所述的一种用于矛盾纠纷事件因果关系识别的深度学习方法,其特征在于,所述步骤5待识别的矛盾纠纷事件描述文本预处理过程如下:
5-1将待识别的每个矛盾纠纷事件描述文本分句,并为每个矛盾纠纷事件描述文中每个句子编码,即依据每个句子在对应的矛盾纠纷事件描述文中的位置分别进行0-N编码;
5-2基于BERT语义编码模型,对步骤(5-1)输出的每个句子进行语义特征编码,输出768维的语义特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中共南通市委政法委员会;江苏飞搏软件股份有限公司,未经中共南通市委政法委员会;江苏飞搏软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911144453.0/1.html,转载请声明来源钻瓜专利网。