[发明专利]一种构建因果关系确定模型的方法、装置和设备在审

申请号：	202011379460.1	申请日：	2020-11-30
公开（公告）号：	CN112329478A	公开（公告）日：	2021-02-05
发明（设计）人：	张茂洪	申请（专利权）人：	北京明略昭辉科技有限公司
主分类号：	G06F40/30	分类号：	G06F40/30;G06F40/242;G06F40/253;G06N3/04;G06N3/08
代理公司：	北京超成律师事务所 11646	代理人：	王晓菲
地址：	100082 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种构建因果关系确定模型方法装置设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供了一种构建因果关系确定模型的方法、装置和设备。所述方法包括：获取原始语料集；所述原始语料集中包括至少一个第一候选文本；根据目标事件因果关系模板在所述原始语料集中筛选第二候选文本；针对每一个第二候选文本，根据所述第二候选文本中每一个词的词向量和每一个字的字向量，确定所述第二候选文本的语句向量；基于每一个第二候选文本的语句向量对待训练的因果关系确定模型进行训练，得到训练好的因果关系确定模型。本申请首先通过以字和词同时作为表达语义的表示形式，提高了表达语义的准确度，进而可以通过分析语义有效识别出具有隐性因果关系的文本。

技术领域

本发明涉及深度学习技术领域，具体而言，涉及一种构建因果关系确定模型的方法、装置和设备。

背景技术

中文的因果关系包含很多特点，首先，中文语料具有价值稀疏性、碎片性和隐含性；其次，一个事件在不同语境下，可能是原因，也可能是结果。因此，因果关系识别比较困难。

现有技术中，因果关系的识别主要通过模板匹配方法，通过模板匹配方法识别因果关系虽然具有很高的准确率，但是仅能识别显性因果关系，隐性因果关系识别率低。

发明内容

有鉴于此，本发明的目的在于提供一种构建因果关系确定模型的方法、装置和设备，解决了现有技术中确定具有隐性因果关系的文本识别率低的问题。

第一方面，本申请实施例提供了一种构建因果关系确定模型的方法，该方法包括：

获取原始语料集；所述原始语料集中包括至少一个第一候选文本；

根据目标事件因果关系模板在所述原始语料集中筛选第二候选文本；

针对每一个第二候选文本，根据所述第二候选文本中每一个词的词向量和每一个字的字向量，确定所述第二候选文本的语句向量；

基于每一个第二候选文本的语句向量对待训练的因果关系确定模型进行训练，得到训练好的因果关系确定模型。