[发明专利]能感知对话上下文相对位置信息的多轮对话文本生成方法有效

申请号：	202110575909.X	申请日：	2021-05-26
公开（公告）号：	CN113342947B	公开（公告）日：	2022-03-15
发明（设计）人：	曾碧卿;甘子邦;池俊龙;邓会敏	申请（专利权）人：	华南师范大学;广东农工商职业技术学院
主分类号：	G06F16/332	分类号：	G06F16/332;G06F40/211;G06F40/30;G06N3/04;G06N3/08
代理公司：	广州骏思知识产权代理有限公司 44425	代理人：	张金龙
地址：	528225 广东省佛山市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	感知对话上下文相对位置信息轮对文本生成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种能感知对话上下文相对位置信息的多轮对话文本生成方法，其特征在于，包括以下步骤：

构建多轮对话文本生成模型，包括输入层、上下文自注意力层、响应自注意力层、隐变量层、角色嵌入层和解码器层；其中，所述输入层包括词嵌入层和编码器；

将一个由多个话语序列组成的对话u＝(u₀，u₁，...，u_n-1)输入至所述输入层，经过双向编码处理得到由词嵌入序列组成的词嵌入表示矩阵针对序号为i的话语文本，经过输入层的编码器处理得到话语表示C_i＝h_i＝uRNN(U_i，h_i-1)；

将所述话语表示Ci输入至所述上下文自注意力层，引入话语的位置嵌入PE，基于多头自注意力机制，得到带有相对位置信息的对话上下文话语间注意力表示O_c；其中，位置嵌入PE为自注意力层的学习参数，计算公式如下：

将对话响应R和位置嵌入PE输入至所述响应自注意力层，得到对话响应的注意力表示O_R；其中，对话响应R为在训练语料中对一个样例的候选回复进行编码后的语义向量，由候选回复经过RNN编码后得到；

将所述上下文话语间注意力表示O_c和所述对话响应的注意力表示O_R输入至所述隐变量层，计算得到隐变量l；

将上下文话语文本输入至角色嵌入层，初始化两个门控循环单元模块EvenGRU和OddGRU；其中，EvenGRU为针对当前响应是对话的偶数轮的门控循环单元模块，OddGRU为针对当前响应是对话的奇数轮的门控循环单元模块；

将上下文话语文本输入EvenGRU和OddGRU，根据如下公式，得到角色嵌入RE_i：

其中，i为上下文话语文本的序号，c_n为上下文话语文本；

将词嵌入序列e、所述对话上下文话语间注意力表示O_c和所述角色嵌入RE_i输入至所述解码器层，计算词汇表中词的输出概率，输出概率最大的词。

2.根据权利要求1所述的一种能感知对话上下文相对位置信息的多轮对话文本生成方法，其特征在于，将所述上下文话语间注意力表示O_c和所述对话响应的注意力表示O_R输入至所述隐变量层，计算得到隐变量l，包括：

将所述上下文话语间注意力表示O_c和所述对话响应的注意力表示O_R连接在一起，通过激活函数tanh馈入一个两层前馈网络；

对前馈网络的输出进行线性变换来定义后验均值μ_posterior；

对前馈网络的输出进行不同的线性变换；

使用softplus函数定义后验协方差矩阵∑_posterior；

利用公式P_θ(l|u₀，...，u_n-1)＝N(μ_posterior，∑_posterior)，从多变量正态分布N(μ，∑)中采样隐变量1。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南师范大学;广东农工商职业技术学院，未经华南师范大学;广东农工商职业技术学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110575909.X/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载