[发明专利]一种自然语言要素抽取模型的训练方法及装置有效
申请号: | 201910243868.7 | 申请日: | 2019-03-28 |
公开(公告)号: | CN109978060B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 李嘉伟;盛志超 | 申请(专利权)人: | 科大讯飞华南人工智能研究院(广州)有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06N5/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张小娜;王宝筠 |
地址: | 511458 广东省广州市南沙区丰泽东路106*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自然语言 要素 抽取 模型 训练 方法 装置 | ||
1.一种自然语言要素抽取模型的训练方法,其特征在于,包括:
获取目标领域的知识图谱;
生成所述知识图谱中各个节点的目标表示结果,所述目标表示结果携带了对应节点的节点内容的语义信息、以及对应节点的节点内容与周边节点的节点内容之间的语义关系;
利用包含所述知识图谱中的各个标签节点的节点内容的样本问题,以及所述知识图谱中各个标签节点的目标表示结果,对自然语言要素抽取模型进行训练。
2.根据权利要求1所述的方法,其特征在于,所述知识图谱包括具有连接关系的各个标签节点、以及与所述标签节点互为邻接节点的各个实例节点;
其中,所述标签节点对应于标签内容,所述标签节点的实例节点对应于与所述标签内容相关的实例内容。
3.根据权利要求2所述的方法,其特征在于,对所述自然语言要素抽取模型进行训练之后,还包括:
更新所述目标领域的知识图谱;
基于更新后的知识图谱,继续执行所述生成所述知识图谱中各个节点的目标表示结果的步骤。
4.根据权利要求3所述的方法,其特征在于,所述更新所述目标领域的知识图谱,包括:
对于所述知识图谱中的各个标签节点,生成包含所述标签节点的标签内容的第一样本问题;
利用当前的自然语言要素抽取模型,从所述目标领域的样本知识数据中抽取所述第一样本问题的各条答案;
基于所述各条答案为所述标签节点添加或更新实例节点。
5.根据权利要求4所述的方法,其特征在于,所述基于所述各条答案为所述标签节点添加实例节点,包括:
确定所述各条答案中的每条答案的置信度,并从所述各条答案中选取置信度高的N条答案;
将所述N条答案分别作为N个实例节点的实例内容,并将该N个实例节点作为所述标签节点的实例节点。
6.根据权利要求4所述的方法,其特征在于,所述基于所述各条答案为所述标签节点更新实例节点,包括:
确定所述各条答案中的每条答案的置信度,并从所述各条答案中选取置信度高的N条答案;
将所述N条答案分别作为N个实例节点的实例内容;
若所述知识图谱中的实例节点的个数达到预设的个数阈值,则从所述知识图谱中选取置信度低的M个实例节点的实例内容;
将所述N个实例节点与所述M个实例节点对应的置信度进行排序,从中挑选对应置信度高的Q个实例节点,使所述标签节点的各个实例节点中包括所述Q个实例节点且不包括所述M个实例节点中未被挑选的实例节点。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述生成所述知识图谱中各个节点的目标表示结果,包括:
生成所述知识图谱中的每一已有节点的初始表示结果,所述初始表示结果携带了所述已有节点的节点内容的语义信息;
根据所述已有节点的初始表示结果以及所述已有节点的周边节点的初始表示结果,生成所述已有节点的目标表示结果,所述目标表示结果携带了所述已有节点的节点内容的语义信息、以及所述已有节点的节点内容与所述周边节点的节点内容之间的语义关系。
8.根据权利要求2至6任一项所述的方法,其特征在于,所述利用包含所述知识图谱中的各个标签节点的节点内容的样本问题,以及所述知识图谱中各个标签节点的目标表示结果,对自然语言要素抽取模型进行训练,包括:
对于所述知识图谱中的各个标签节点,生成包含所述标签节点的节点内容的第二样本问题;
将所述第二样本问题的问题表示结果与所述标签节点的目标表示结果进行拼接,得到拼接表示结果;
根据所述拼接表示结果,从所述目标领域的样本知识数据中抽取所述第二样本问题的答案,根据抽取答案与实际答案之间的差异,对所述自然语言要素抽取模型的参数进行更新。
9.一种要素抽取方法,其特征在于,包括:
获取属于目标领域的目标文本;
利用权利要求1至8任一项所述的方法训练得到的自然语言要素抽取模型,对所述目标文本进行要素抽取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞华南人工智能研究院(广州)有限公司,未经科大讯飞华南人工智能研究院(广州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910243868.7/1.html,转载请声明来源钻瓜专利网。