[发明专利]一种基于多标签分类的实体关系联合抽取模型的建立方法有效
申请号: | 202010937094.0 | 申请日: | 2020-09-08 |
公开(公告)号: | CN112069328B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 李爱平;刘运璇;贾焰;江荣;周斌;涂宏魁;王晔 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/30;G06F40/284;G06N3/04 |
代理公司: | 西安研创天下知识产权代理事务所(普通合伙) 61239 | 代理人: | 郭璐 |
地址: | 410073 湖南省长沙市开*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 分类 实体 关系 联合 抽取 模型 建立 方法 | ||
本发明公开了一种基于多标签分类的实体关系联合抽取模型的建立方法,包括:S1.搭建基于Encoder‑Decoder的模型框架;S2.设计基于多标签分类的实体关系联合抽取模型的标注方式;S3.设计基于DCNN和Bi‑LSTM的编码器;S4.设计基于CNN链和Attention的解码器;S5.设计基于Encoder‑Decoder模型框架的三元组正确性评估模块;通过利用Encoder‑Decoder模型框架将实体抽取和关系抽取放在同一个模型中进行,解决了串联抽取存在的问题,实验证明本模型能够在包含很多错误标注的数据集上进行训练并得到好的测试结果,具有强的鲁棒性。
技术领域
本发明涉及数字处理技术领域,具体涉一种基于多标签分类的实体关系联合抽取模型的建立方法。
背景技术
知识图谱技术分为知识图谱建立技术和应用技术,属于语义Web、自然语言处理和机器学习的交叉学科,虽然知识图谱对于大数据人工智能的实现有非凡的意义,但是知识图谱的构建过程十分困难;现有的知识图谱包括WordNet、CYC和HowNet等,大多依靠专家人工撰写,在该种方法中,知识图谱所包含的实体、实体属性及实体关系需要完全依靠专家人工构造,其中存在的问题有以下几个方面:
(1)虽然依靠专家进行知识图谱构建可以获得精度较高的知识,然而人工构建知识图谱耗费的人力资源巨大;
(2)随着互联网的发展,知识呈爆炸式增长,人工构建知识图谱,尤其是在构建领域知识图谱方面遇到了很大困难,该方式不仅费时费力,而且存在知识覆盖率低、数据稀疏和更新缓慢等问题,其规模和构建速度已经无法适应大数据时代发掘大量涌现知识的需求;自动构建知识库能很好的解决人工构建知识库的弊端;知识库的构建包括实体关系学习、实体识别与链接、事件知识学习等多个任务,其多个任务可以独立进行;目前实体识别、关系抽取等任务多数采用机器学习的方法自动进行知识抽取,极大的减轻了人力资源的消耗,具有较好的可扩展性,具备快速构建大规模知识库的能力;
关系抽取作为知识图谱构建和信息抽取中的一个关键环节,为多种应用提供支持,具有重要的理论意义和广阔的应用前景,主要包括实体关系串联抽取和实体关系联合抽取,在传统的串联抽取模型中,由于实体抽取和关系抽取的分离导致了抽取过程中误差积累的问题,在实体关系的抽取过程中,如何实现三元组的重叠问题,成为了本领域研究急需解决的一个问题。
发明内容
针对上述存在的问题,本发明旨在提供一种基于多标签分类的实体关系联合抽取模型的建立方法,通过利用Encoder-Decoder模型框架将实体抽取和关系抽取放在同一个模型中进行,解决了串联抽取存在的问题,且通过实验证明本模型能够在包含很多错误标注的数据集上进行训练并得到较好的测试结果,具有较强的鲁棒性,对于关系抽取的研究具有重要意义。
为了实现上述目的,本发明所采用的技术方案如下:
一种基于多标签分类的实体关系联合抽取模型的建立方法,包括:
S1.搭建基于Encoder-Decoder的模型框架;
S2.设计基于多标签分类的实体关系联合抽取模型的标注方式:根据句子S中的实体关系的数量,为句子S标注相同数量的标签序列,且在每个序列中只标注一对实体及实体间的关系;
S3.设计基于DCNN和Bi-LSTM的编码器,利用DCNN和Bi-LSTM的编码器将3层空洞卷积输出的语义单元表示,与步骤S2Bi-LSTM输出的单词语义信息相连接,共同作为编码器的输出,实现将不同长度的句子编码为固定长度的向量;
S4.设计基于CNN链和Attention的解码器,实现利用CNN链和Attention将得到的语义信息生成多个实体关系三元组,进行实体关系的抽取;
S5.设计基于Encoder-Decoder模型框架的三元组正确性评估模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010937094.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种碳素纤维机器人手臂叉的表面处理方法
- 下一篇:一种用于果园的地下灌溉管