[发明专利]一种意图槽值双向交互的自然语言理解方法在审
申请号: | 202210672522.0 | 申请日: | 2022-06-14 |
公开(公告)号: | CN115062624A | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 黄亮;梁森杰;叶飞扬;池凯凯;张书彬 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 忻明年 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 意图 双向 交互 自然语言 理解 方法 | ||
1.一种意图槽值双向交互的自然语言理解方法,其特征在于,所述意图槽值双向交互的自然语言理解方法,包括:
采用BERT语义编码模块对用户输入的话语进行文本预处理,并进行语义编码,获得语义表示向量H,所述语义表示向量H包括意图语义表示向量HI和槽语义表示向量HS;
将意图表示向量HI输入到意图注意力模块,生成语义增强的意图表示向量HIW;
通过自注意语义交互模块,双向交互语义增强的意图语义表示向量HIW和槽语义表示向量HS,获得最终的意图语义表示向量和槽语义表示向量;
将最终的意图表示向量和槽语义表示向量输入到CRF语义解码模块,获得最后话语的意图和槽值,所述CRF语义解码模块包括两个分支,一个分支包括意图全连接神经网络模块,另一个分支包括槽全连接神经网络模块和CRF槽解码模块;
其中,所述将意图表示向量HI输入到意图注意力模块,生成语义增强的意图表示向量HIW,包括:
获取CRF语义解码模块中意图全连接神经网络的权重WI,与意图语义表示向量HI进行矩阵相乘,再经过softmax函数,获得softmax的输出α:
α=softmax(HIWI);
然后将α与权重WI相乘再与意图语义表示向量HI相加,获得经过意图注意力模块语义增强的意图语义表示向量HIW:
HIW=HI+αWI;
所述通过自注意语义交互模块,双向交互语义增强的意图语义表示向量HIW和槽语义表示向量HS,获得最终的意图语义表示向量和槽语义表示向量,包括:
连接语义增强的意图语义表示向量HIW和槽意图语义表示向量HS,获取语义表示向量HIS:
HIS=[HIW,HS];
将HIS经过h次线性映射获取Q、K和V矩阵。
Qj=HISWjQ;
Kj=HISWjK;
Vj=HISWjV;
其中WjQ、WjK和WjV是线性映射的参数,j∈1...h;
将获得的Q、K和V矩阵平行地进行缩放点乘注意力操作,获得自注意力头:
其中d表示语义表示向量HIS的维度;
将获得的h个自注意力头进行连接,并经过一个线性映射,获得经过多头自注意力模块语义增强的语义向量HM:
HM=concat(h1,h2,…,hh)WO;
其中WO是本次线性映射的参数;
将语义向量HM与BERT语义编码模块输出的语义表示向量H相加,并进行层归一化(layernormalization)操作:
H′=LayerNorm(H+HM);
其中语义向量为自注意语义交互模块的输出,表示最终的意图语义表示向量,表示最终的槽语义表示向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210672522.0/1.html,转载请声明来源钻瓜专利网。