[发明专利]基于神经网络的实体关系抽取方法及装置有效
申请号: | 201910722284.8 | 申请日: | 2019-08-06 |
公开(公告)号: | CN112347196B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 陈培华;陈成才 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/21;G06F16/23;G06F16/2458 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 胡彬 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 实体 关系 抽取 方法 装置 | ||
本发明提供了一种基于神经网络的实体关系抽取方法及装置,所述方法包括:对待处理的句子信息依次进行分词处理、实体识别、向量化处理、融合处理、全局平均池化处理、筛选处理、去噪处理、更新处理和降维处理以得到一个目标特征,然后根据所述目标特征就可以计算所述实体对的实体关系。本发明通过多方面、多角度挖掘句子及句子中实体间的关系,将这种多方面多角度的表示进行融合,进而更准确更全面地进行实体关系抽取,方法简便、高效,成本低廉,且能够在不同数据领域之间进行迁移;通过增加筛选处理滤除了对实体关系预测贡献不大的噪声特征,节省了后续的计算量,提高了抽取的效率。
技术领域
本发明涉及自然语言处理技术领域,特别涉及一种基于神经网络的实体关系抽取方法、自动问答方法、基于神经网络的实体关系抽取装置、存储介质及电子设备。
背景技术
现如今,随着网络信息资源的日渐丰富、计算机速度的大幅度提高,主要以文字、图像等形式为依托的信息化时代强势到来。信息化时代的标志是信息爆发价值,如今信息化成为了时代发展的主流趋势,是前沿生产力的主要标志。随着信息时代的高速发展,信息数据呈现规模巨大、模态多样和高速增长等特征。在网络搜索过程中,当用户输入要查询的信息时,希望计算机能够从语义层面理解用户真实想要获取的信息,而不只是关键字的提取和搜索,这就迫切要求能快速、准确地获取用户真正所需信息的技术手段-信息抽取技术的进一步发展,以满足用户搜索的需求。比如说,当用户输入“英国伦敦”时,希望得到的是关于英国伦敦这座城市的多方面相关信息,如政治、经济、文化、地理位置、旅游景点、教育机制等,而不仅仅是简单的关于伦敦的关键字的句子提取。
信息抽取的研究内容主要包括三个方面:实体抽取、实体关系抽取、事件抽取。实体关系抽取是核心任务,其问题定义为“输入一段文本,抽取出每句话中的实体及其之间的语义关系”。目前的研究主要是指从一句话中抽取出两个实体及语义关系,通常用三元组(实体1,关系,实体2)表示。
在商业需求的推动下,实体关系抽取方法从上世纪九十年代基于知识工程的方法发展到近十年基于统计的机器学习方法。随着在线文本数量的增加和硬件计算能力的提高,基于统计的机器学习方法应用广泛,主要分为有监督、半监督和无监督三大类方法。由于有监督的方法准确率和召回率较高,国内外学者大多采用有监督的方法有监督机器学习方法将实体关系抽取视为一个分类任务,将句子中出现的实体关系划分到预先定义好的类别中。近年来,深度学习框架的神经网络模型成为实体关系抽取的新方法,深度学习是一种特殊的有监督机器学习方法,是机器学习的一个分支,不同之处在于神经网络模型自动学习句子特征,无需复杂的特征工程同时能够取得更好的效果,所以受到广泛的应用。
现有技术的关系抽取通常依赖于逻辑规则和手工构建的特征,这些特征耗费劳动力且难以泛化。而基于神经网络的模型也只是端到端训练,输入只是文本及两个实体一方面的信息,而忽视了从不同角度对同一个文本及实体对进行表示,这种单一的表示很容易产生误差,从而影响到最后对两个实体关系的抽取。
因此,如何准确高效地抽取实体关系就成为本领域技术人员亟待解决的技术问题之一。
发明内容
为了解决上述问题,本发明提出一种基于神经网络的实体关系抽取方法、自动问答方法、基于神经网络的实体关系抽取装置、存储介质及电子设备,以提高实体关系抽取的准确率和效率。
根据上述目的,本发明实施例提供了一种基于神经网络的实体关系抽取方法,包括以下步骤:
获取待处理的句子信息;
对所述句子信息进行分词处理,得到多个单独词;
识别所述多个单独词中的实体对,每个实体对包括两个实体;
对所述句子信息进行向量化处理,得到所述句子信息对应的句子向量;
对所述句子向量进行融合处理,得到所述句子信息的多个方面的表示特征,每个所述表示特征包括多个特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910722284.8/2.html,转载请声明来源钻瓜专利网。