[发明专利]一种基于知识图谱与语义图技术的口语理解方法有效
申请号: | 201910315854.1 | 申请日: | 2019-04-19 |
公开(公告)号: | CN110188342B | 公开(公告)日: | 2020-04-07 |
发明(设计)人: | 姜明;滕海滨;张旻;汤景凡;戚铖杰;张雯 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/36;G06F16/35 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 语义 技术 口语 理解 方法 | ||
1.一种基于知识图谱与语义图技术的口语理解方法,其特征在于包括以下步骤:
步骤1、训练序列到动作序列神经网络模型,训练基于句子和句子逻辑表达式的口语理解神经网络;
步骤2、读取需要被解析的自然语言句子;
步骤3、使用文本映射算法扫描并替换句子中与知识图谱中语义资源相匹配的部分;
步骤4、使用序列到动作序列神经网络模型读取替换了语义资源后的句子,然后执行对应的动作序列生成与替换了语义资源后的句子语义相符的语义图,然后使用深度优先算法遍历语义图得到替换了语义资源后的句子的逻辑表达式;
步骤5、使用口语理解神经网络读入替换了语义资源后的句子和逻辑表达式,生成意图信息和槽位信息。
2.根据权利要求1所述的一种基于知识图谱与语义图技术的口语理解方法,其特征在于步骤1中训练的序列到动作序列神经网络模型,包括如下步骤:
1-1.整理出已有的句子与逻辑表达式的关系作为样本集;
1-2.解析句子逻辑表达式生成语义图,对语义图进行深度优先搜索生成构造语义图的动作序列;
1-3.将句子本身与逻辑表达式生成的动作序列做对应,生成一个新的样本集;
1-4.将句子与动作序列的样本集,分割为比例为9:1作为训练集与测试集;训练集送入一个序列到动作序列的神经网络模型中,通过梯度下降算法调整模型参数,使得模型在测试集中的测试结果达到最优;
步骤1中所述的口语理解神经网络,包括如下步骤:
1-1整理已有句子的逻辑表达式与句子的意图信息和槽位信息做对应,整理为样本集;
1-2同样将样本集分割为9∶1作为训练集与测试集;
1-3使用口语理解神经网络在训练集中进行学习,然后在测试集中测试结果;调整参数使用梯度下降法,使得最终槽位信息和意图信息更加准确。
3.根据权利要求1或2所述的一种基于知识图谱与语义图技术的口语理解方法,步骤1或5中的口语理解神经网络,其特征在于,构建一个编码器、解码器结构的循环神经网络,具体如下:
①使用LSTM作为神经网络中的单元;
②编码器结构满足:
hi=LSTM(φ(x)(xi),hi-1) (1)
其中,hi表示对应于输入词语xi的隐藏层状态,LSTM指长短时记忆网络的状态转移方程;φ(x)(xi)表示对于输入词语xi映射到词向量;
③解码器结构满足:
P(yj=w|x,y1:j-1)∝exp(Uw[sj,cj]) (6)
sj+1=LSTM([φ(y)(yj),cj],sj) (7)
其中,sj表示输出步骤为j时的隐藏层状态;表示在序列长度为m的序列上,取正向RNN序列的第m个隐藏层数据,与反向RNN序列中第1个隐藏层的数据拼接,通过解码器隐藏层转换函数计算得到第一个解码器隐藏层状态s1;
eij表示在输出步骤为j时,输入序列第i个单词的注意力评分;其计算过程需要用到输出状态sj的转置以及经过注意力转换函数转换输入词语序列中词语xi的隐藏层状态bi;
aij指输出步骤为i时的词语xj的注意力权重;其中exp指指数函数;yj为输出步骤j的输出结果。
4.根据权利要求3所述的一种基于知识图谱与语义图技术的口语理解方法,步骤1或5中的口语理解神经网络,其特征在于构建一个同时读入句子本身与其逻辑表达式的神经网络,进行意图猜测和槽位解析,具体包括:
(1)逻辑表达式信息提取,逻辑表达式序列对应的前向隐藏层状态lfh=[lfh1,lfh2,lfh3,…,lfh|L|]满足:
类似的,反向隐藏层状态lbh=[lbh1,lbh2,lbh3,…,lbh|L|]同样满足:
逻辑表达式的最终描述结果sL=[lfh|L|,lbh1]
LSTM表示长短时记忆网络的状态转移方程,φl(li)表示逻辑表达式序列单元li在映射方程φl计算下得到对应向量;
(2)进行槽位填充时,更新过程满足:
s0=tanh(W(s)(sL))
(4.17)
si=f(s)(si-1,yi-1,hi,ci)
(4.18)
ei,k=g(si-1,hk)
(4.21)
其中yi-1表示生成的标签序列的第i-1个值;在输出时刻i,ci表示注意力机制下的输入,si表示当前隐藏层状态;W(s)表示隐藏层状态初始化方程,参数sL来自上述步骤(1)中的计算结果;ci表示当前注意力机制下的输入值,ai,j表示当前步骤下输入词语xj的注意力得分,ei,k表示词语xk的权重,根据权重换算公式g计算上一时刻状态si-1与词语隐藏层状态hk得到;
(3)意图解析是对所有的隐藏层状态s=(s1,s2,...,s|w|)汇总,分类,输出意图信息的分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910315854.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种警情分析系统
- 下一篇:基于融合注意力网络的多模态情感识别方法