[发明专利]基于神经网络的实体关系抽取方法及装置有效
申请号: | 201910722284.8 | 申请日: | 2019-08-06 |
公开(公告)号: | CN112347196B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 陈培华;陈成才 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/21;G06F16/23;G06F16/2458 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 胡彬 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 实体 关系 抽取 方法 装置 | ||
1.一种基于神经网络的实体关系抽取方法,其特征在于,包括以下步骤:
获取待处理的句子信息,所述待处理的句子信息是直接采集得到的文本信息或通过语音、图像转换得到的文本信息;
对所述句子信息进行分词处理,得到多个单独词;
识别所述多个单独词中的实体对,每个实体对包括两个实体;所述实体从分词结果中提取,包括:人名、地名、机构名或时间;
预设最小距离和最大距离,在计算单独词相对于一实体的相对距离之后,判断所述相对距离是否在预设的最小距离与最大距离的范围之内,若所述相对距离小于所述最小距离,则以所述最小距离替换所述相对距离;若所述相对距离大于所述最大距离,则以所述最大距离替换所述相对距离;
对所述句子信息进行向量化处理,得到所述句子信息对应的句子向量;
对所述句子向量进行融合处理,得到所述句子信息的多个方面的表示特征,每个所述表示特征包括多个特征向量;
对所述特征向量进行全局平均池化处理,得到每个所述特征向量对应的聚合信息;
利用两个全连接网络对所述聚合信息进行筛选处理,得到每个所述特征向量对应的筛选参数;具体分别采用Relu函数和softsign函数作为两个所述全连接网络的激活函数,即:sj=softsign(W2ReLu(W1zj)),其中,zj为特征向量cj对应的筛选参数,W1、W2分别为两个全连接网络的参数矩阵;
根据所述筛选参数判断所述特征向量是否为噪声特征,若是,则将所述特征向量屏蔽,并更新剩余的所述特征向量,得到更新后的特征向量;
根据更新后的所述特征向量,更新所述多个方面的表示特征;
对更新后的多个方面的表示特征进行降维处理,得到一个目标特征;
根据所述目标特征计算所述实体对的实体关系;
所述句子向量包括多个所述单独词的词-位置向量,所述单独词的词-位置向量包括所述单独词的词向量以及所述单独词与所述实体对的相对位置向量;
对所述句子向量进行融合处理,得到所述句子信息的多个方面的表示特征采用以下公式处理:
其中,hi为第i个方面的所述表示特征,i的取值范围为[1,l],l为预设次数,v为所述句子向量,dv为构成所述句子向量的单独词的数目,和分别表示第i次计算时的不同的参数矩阵且分别通过神经网络训练获得;所述预设次数的取值在5-12之间;
根据所述筛选参数判断所述特征向量是否为噪声特征,若是,则将所述特征向量屏蔽,并更新剩余的所述特征向量,得到更新后的特征向量采用以下公式处理:
其中,所述cj表示第j项所述特征向量,所述xj为所述cj对应的所述更新后的特征向量,所述sj为所述cj对应的所述筛选参数;
所述降维处理包括:
将每个方面的所述表示特征分别放入卷积神经网络的一个单独通道;
对于每一所述单独通道,通过下述公式计算所述目标特征中的每个特征向量:
cj=f(wf·h(i:i+n-1)+bf)
其中,j的取值范围为[1,m],cj表示所述融合特征中的第j项特征向量,m为卷积核的个数,f为非线性函数,wf为参数矩阵,bf为偏置参数,h(i:i+n-1)由hi、hi+1、…、hi+n-1依次连接组成,n为卷积窗口的长度,hi表示第i个方面的所述表示特征;
根据计算得到的m个特征向量生成所述目标特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910722284.8/1.html,转载请声明来源钻瓜专利网。