[发明专利]能感知对话上下文相对位置信息的多轮对话文本生成方法有效
申请号: | 202110575909.X | 申请日: | 2021-05-26 |
公开(公告)号: | CN113342947B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 曾碧卿;甘子邦;池俊龙;邓会敏 | 申请(专利权)人: | 华南师范大学;广东农工商职业技术学院 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/211;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 张金龙 |
地址: | 528225 广东省佛山市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 感知 对话 上下文 相对 位置 信息 轮对 文本 生成 方法 | ||
1.一种能感知对话上下文相对位置信息的多轮对话文本生成方法,其特征在于,包括以下步骤:
构建多轮对话文本生成模型,包括输入层、上下文自注意力层、响应自注意力层、隐变量层、角色嵌入层和解码器层;其中,所述输入层包括词嵌入层和编码器;
将一个由多个话语序列组成的对话u=(u0,u1,...,un-1)输入至所述输入层,经过双向编码处理得到由词嵌入序列组成的词嵌入表示矩阵针对序号为i的话语文本,经过输入层的编码器处理得到话语表示Ci=hi=uRNN(Ui,hi-1);
将所述话语表示Ci输入至所述上下文自注意力层,引入话语的位置嵌入PE,基于多头自注意力机制,得到带有相对位置信息的对话上下文话语间注意力表示Oc;其中,位置嵌入PE为自注意力层的学习参数,计算公式如下:
将对话响应R和位置嵌入PE输入至所述响应自注意力层,得到对话响应的注意力表示OR;其中,对话响应R为在训练语料中对一个样例的候选回复进行编码后的语义向量,由候选回复经过RNN编码后得到;
将所述上下文话语间注意力表示Oc和所述对话响应的注意力表示OR输入至所述隐变量层,计算得到隐变量l;
将上下文话语文本输入至角色嵌入层,初始化两个门控循环单元模块EvenGRU和OddGRU;其中,EvenGRU为针对当前响应是对话的偶数轮的门控循环单元模块,OddGRU为针对当前响应是对话的奇数轮的门控循环单元模块;
将上下文话语文本输入EvenGRU和OddGRU,根据如下公式,得到角色嵌入REi:
其中,i为上下文话语文本的序号,cn为上下文话语文本;
将词嵌入序列e、所述对话上下文话语间注意力表示Oc和所述角色嵌入REi输入至所述解码器层,计算词汇表中词的输出概率,输出概率最大的词。
2.根据权利要求1所述的一种能感知对话上下文相对位置信息的多轮对话文本生成方法,其特征在于,将所述上下文话语间注意力表示Oc和所述对话响应的注意力表示OR输入至所述隐变量层,计算得到隐变量l,包括:
将所述上下文话语间注意力表示Oc和所述对话响应的注意力表示OR连接在一起,通过激活函数tanh馈入一个两层前馈网络;
对前馈网络的输出进行线性变换来定义后验均值μposterior;
对前馈网络的输出进行不同的线性变换;
使用softplus函数定义后验协方差矩阵∑posterior;
利用公式Pθ(l|u0,...,un-1)=N(μposterior,∑posterior),从多变量正态分布N(μ,∑)中采样隐变量1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学;广东农工商职业技术学院,未经华南师范大学;广东农工商职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110575909.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:喷涂前处理装置
- 下一篇:碳纳米管防静电涂层及其制备方法与应用