[发明专利]一种面向知识图谱问答的复合问句解析方法有效
申请号: | 202010166812.9 | 申请日: | 2020-03-11 |
公开(公告)号: | CN111444316B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 陈华钧;杨帆;杨海宏 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/36;G06N3/0442;G06N3/045;G06N3/048;G06N3/084;G06N3/092 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 知识 图谱 问答 复合 问句 解析 方法 | ||
1.一种面向知识图谱问答的复合问句解析方法,其特征在于,包括:
(1)接收客户提出的复合问题,获得复合问题的中心词,作为查询的起点;
(2)在解耦器中,将复合问题分解为多个简单问题,其中,解耦器包括输入模块、记忆模块和动作模块,
其中,所述输入模块中每个单词都对应一个嵌入向量和一个动作,每个动作对应一个独热嵌入向量,独热嵌入向量a={a1,a2,……ai,aN},ai为每个单词的独热嵌入向量,嵌入向量e={e1,e2,……ei,eN},ei为每个单词的嵌入向量,输入模块在迭代过程中,将单词的嵌入向量与该单词对应的上一次的动作的独热嵌入向量连接起来,得到输出向量作为记忆模块的输入向量,每个单词对应的记忆模块的输入向量xi=[ei,ai-1],ei为每个单词的嵌入向量;ai-1为每个单词对应的上一次的动作的独热嵌入向量;
所述记忆模块利用长短期记忆神经网络LSTM存储输入模块的输出向量,在每次迭代时更新记忆模块所处状态,并输出记忆模块当前层所处的状态与当前所处的隐藏状态的两个状态的连接作为解耦器当前所处的状态向量,其中,记忆模块所处状态通过以下公式计算:
ii=σ(wi[xi,hi-1]+bi)
fi=σ(wf[xi,hi-1]+bf)
gi=tanh(wg[xi,hi-1]+bg)
oi=σ(wo[xi,hi-1]+bo)
ci=fi⊙ci-1+ii⊙gi
hi=oi⊙tanh(ci)
其中,xi为记忆模块第i步的输入的输入模块的输出向量;hi-1,hi为记忆模块上一层和当前层的隐藏状态;ci-1,ci表示记忆模块中上一层和当前层的状态;Wi,Wf,Wo分别对应LSTM中输入门,遗忘门以及输出门的参数矩阵;bi,bf,bo为LSTM中输入门,遗忘门以及输出门的偏置;ii,fi,oi为LSTM中输入门,遗忘门以及输出门的输出;gi表示转换后的第i步的输入,用于之后更新当前状态ci,wg,bg分别为转换过程的参数矩阵和偏置;[]表示两个向量的拼接操作;⊙表示两个向量的内积运算;σ表示sigmoid函数;
记忆模块当前层所处的状态与当前所处的隐藏状态的两个状态的连接通过以下公式计算:
si=[ci,hi]
其中,si表示记忆模块第i步所处的状态ci与当前所处的隐藏状态hi的连接;
所述动作模块根据解耦器当前所处状态选择相应的动作,帮助决定后续的状态转移;根据解耦器当前状态选择两层的前馈神经网络生成选择的动作,迭代完成后,复合问题的每个单词都对应着一个动作,把拥有相同动作的单词聚合为一组,表示一个简单问题,这样就将一个复合问题分解为了多个简单问题;
(3)在关系检测器中,计算步骤(2)得到的简单问题与各个候选关系的匹配概率,选择概率最大的关系作为该简单问题所属的关系,以中心词为起点、各个简单问题所属的关系为边,在知识图谱中进行匹配,得到复合问题的答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010166812.9/1.html,转载请声明来源钻瓜专利网。