[发明专利]一种文本信息的知识图谱关系抽取方法、装置及终端有效
申请号: | 201911291310.2 | 申请日: | 2019-12-16 |
公开(公告)号: | CN111046185B | 公开(公告)日: | 2023-02-24 |
发明(设计)人: | 邓蔚;李子杨;胡峰;林智敏;黄媛;王晓浪 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F40/279 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 信息 知识 图谱 关系 抽取 方法 装置 终端 | ||
本发明涉及信息技术领域,涉及一种文本信息的知识图谱关系抽取方法、装置及终端;所述方法包括获取待抽取知识图谱关系的文本信息;使用多种词向量模型分别构建文本信息的词向量;将分别构建的词向量进行横向拼接,得到最终词向量;采用多层SKnet网络抽取出最终词向量的关系特征;将关系特征进行混合池化操作,将混合池化后的关系特征放入分类器中,得到该关系特征所属的文本信息的知识图谱关系抽取标签。本发明将不同词向量工具生成的词向量进行拼接从而增加词语信息;通过多层SKnet网络抽取词向量特征;对抽取后的特征进行混合池化操作,能够得到信息更加丰富、准确的关系特征。本发明抽取出能够提高抽取文本信息关系的效率。
技术领域
本发明涉及信息技术领域,具体涉及一种文本信息的知识图谱关系抽取方法、装置及终端。
背景技术
随着互联网的飞速发展,各种资源信息日渐丰富甚至呈爆炸式增长;而文字承载着丰富的信息,对文本的研究越来越需要被重视。所以从庞大的文本中抽取出关注的内容十分重要,信息抽取目的是为人们提供有力的信息获取工具。而目前基于远程监督深度学习的关系抽取方法已有了长足发展,其能够应用在大数据背景下,可将基于远程监督的深度学习的关系抽取分为四个模块:词嵌入、句子特征抽取、注意力选择机制和分类;其中句子特征抽取是关系抽取中需要着重关注的模块,句子特征的质量决定着最终关系抽取的质量,所以在句子的特征抽取中,引入优秀的特征抽取网络是需要努力的方向。引入高质量的特征抽取网络,能够提升句子特征抽取质量,从而能够极大提升知识图谱的关系抽取质量,得到更加准确的抽取信息。
目前关系抽取任务中多采用卷积神经网络及其变种,如CNN对句子进行卷积进行特征抽取,将得到的特征进行池化,最终送入softmax层得到所需要抽取的语义关系。但是目前在关系抽取任务中所使用的网络无法进行卷积核尺寸的动态选择,所以无法得到最适合关系抽取任务的特征;另外其池化方法忽略了位置信息,也造成了信息获取能力不足。
发明内容
为了提升知识图谱关系抽取效果,得到更加准确的抽取效果,本发明在关系抽取任务中基于SKnet网络,能够动态选择卷积核大小,获得更合适的特征,并且提出一种新的池化方法,能够最大限度捕获更多的信息、保留位置信息;本发明极大限度的提升了网络的特征抽取能力,从而提升关系抽取任务质量。为了提升知识图谱关系抽取效果;本发明提出了一种文本信息的知识图谱关系抽取方法、装置及终端,包括:
在本发明的第一方面,一种文本信息的知识图谱关系抽取方法,包括以下步骤:
获取待抽取知识图谱关系的文本信息;
使用多种词向量模型分别构建待抽取知识图谱关系的文本信息的词向量;
将分别构建的词向量进行横向拼接,得到待抽取知识图谱关系的文本信息的最终词向量;
采用多层SKnet网络抽取出最终词向量的关系特征;
将抽取出的关系特征进行混合池化操作,获取更多位置信息;
将混合池化后的关系特征放入softmax分类器,获取该关系特征所属的标签。
进一步的,所述多种词向量模型包括采用Word2vec模型、Glove模型以及BERT模型。
优选的,所述最终词向量还包括在横向拼接后词向量末端增加位置信息,所述位置信息包括文本中每个词和实体之间的相对位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911291310.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种在VR和VR全景中实现商品预订的方法
- 下一篇:一种加压设备的调压安全阀
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置