[发明专利]一种融合多路注意力机制的智能对话系统在审
申请号: | 202110776034.X | 申请日: | 2021-07-09 |
公开(公告)号: | CN113505208A | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 廖祥文;陈甘霖;蔡鸿杰;林建洲;杨思源 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈鼎桂;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 注意力 机制 智能 对话 系统 | ||
1.一种融合多路注意力机制的智能对话系统,其特征在于,包括依次连接的编码器模块、多路注意力模块、动态融合模块、外部知识模块和解码器模块;
所述编码器模块,用于针对历史上下文进行多领域的编码;
所述多路注意力模块,用于提取上下文单词之间的注意力关系;
所述动态融合模块,用于融合编码器和注意力的编码结果;
所述外部知识模块,用于辅助生成特定领域知识的句子内容;
所述解码器模块,用于生成具体的句子内容。
2.根据权利要求1所述的一种融合多路注意力机制的智能对话系统,其特征在于,所述编码器模块包括私有编码器和共享编码器。
3.根据权利要求2所述的一种融合多路注意力机制的智能对话系统,其特征在于,所述编码器模块从历史上下文中提取通用领域的编码信息,特定领域的编码信息以及领域与领域之间的编码信息,具体如下:
利用双向GRU对历史上下文进行编码,每个领域都有自己特有的专属的私有编码器,以及一个共享编码器,故在编码器模块的编码器总数为领域总数+1;
所述专属的私有编码器用于提取领域的特定知识,共享编码器用于提取领域之间的公有特征;
编码器公式如下:
hi=BiGRU(e(x),hi-1)
其中hi是i时刻的隐含层向量,e(x)代表历史上下文单词x的词嵌入表示。最终生成全局上下文隐含层向量定义共享编码器生成的全局上下文隐含层表示为特定域的全局上下文隐含层向量为这里上标di代表领域i的编码。
4.根据权利要求3所述的一种融合多路注意力机制的智能对话系统,其特征在于,所述编码器在训练过程中引入一个对抗训练的方式,具体是:构建一个CNN的域分类器来识别对话历史和回复表示的共享表示域,通过引入梯度反转层,使得模型一方面最小化领域分类的误差,另一方面更新分类器底层网络最大化域分类损失。
5.根据权利要求1所述的一种融合多路注意力机制的智能对话系统,其特征在于,所述多路注意力模块融合多头注意力,双线性注意力以及拼接注意力注意力机制,并在融合机制后追加一个注意力模块。
6.根据权利要求5所述的一种融合多路注意力机制的智能对话系统,其特征在于,所述多头自注意力公式如下:
对于多头自注意力而言,Q=K=V=H,为当前编码的单词矩阵;dk代表Q和K的维度;
拼接自注意力公式如下:
其中代表t时刻第j个单词的自注意力,代表t时刻单词i的权重,代表t时刻的拼接自注意力,和代表拼接注意力的权重矩阵,是权重向量,N是单词的总数;最终生成一个拼接自注意力表示Hconcat;
双线性自注意力公式如下:
其中代表t时刻第j个单词的自注意力,代表t时刻单词i的权重,代表t时刻的双线性自注意力,Wbi双线性注意力的权重矩阵,N是单词的总数;最终生成一个双线性自注意力表示Hbi。
7.根据权利要求5所述的一种融合多路注意力机制的智能对话系统,其特征在于,所述在融合机制后追加一个注意力模块,具体为:利用GLU网络,公式如下:
其中,W1、W2是可训练矩阵,b1、b2是偏置,X是注意力的输入,即双向GRU编码的结果HAtt代表注意力的结果包括HAtt、Hbi和Hconcat,δ是sigmoid激活函数,代表矩阵元素点乘,代表拼接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110776034.X/1.html,转载请声明来源钻瓜专利网。