[发明专利]能感知对话上下文相对位置信息的多轮对话文本生成方法有效

专利信息
申请号: 202110575909.X 申请日: 2021-05-26
公开(公告)号: CN113342947B 公开(公告)日: 2022-03-15
发明(设计)人: 曾碧卿;甘子邦;池俊龙;邓会敏 申请(专利权)人: 华南师范大学;广东农工商职业技术学院
主分类号: G06F16/332 分类号: G06F16/332;G06F40/211;G06F40/30;G06N3/04;G06N3/08
代理公司: 广州骏思知识产权代理有限公司 44425 代理人: 张金龙
地址: 528225 广东省佛山市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 感知 对话 上下文 相对 位置 信息 轮对 文本 生成 方法
【权利要求书】:

1.一种能感知对话上下文相对位置信息的多轮对话文本生成方法,其特征在于,包括以下步骤:

构建多轮对话文本生成模型,包括输入层、上下文自注意力层、响应自注意力层、隐变量层、角色嵌入层和解码器层;其中,所述输入层包括词嵌入层和编码器;

将一个由多个话语序列组成的对话u=(u0,u1,...,un-1)输入至所述输入层,经过双向编码处理得到由词嵌入序列组成的词嵌入表示矩阵针对序号为i的话语文本,经过输入层的编码器处理得到话语表示Ci=hi=uRNN(Ui,hi-1);

将所述话语表示Ci输入至所述上下文自注意力层,引入话语的位置嵌入PE,基于多头自注意力机制,得到带有相对位置信息的对话上下文话语间注意力表示Oc;其中,位置嵌入PE为自注意力层的学习参数,计算公式如下:

将对话响应R和位置嵌入PE输入至所述响应自注意力层,得到对话响应的注意力表示OR;其中,对话响应R为在训练语料中对一个样例的候选回复进行编码后的语义向量,由候选回复经过RNN编码后得到;

将所述上下文话语间注意力表示Oc和所述对话响应的注意力表示OR输入至所述隐变量层,计算得到隐变量l;

将上下文话语文本输入至角色嵌入层,初始化两个门控循环单元模块EvenGRU和OddGRU;其中,EvenGRU为针对当前响应是对话的偶数轮的门控循环单元模块,OddGRU为针对当前响应是对话的奇数轮的门控循环单元模块;

将上下文话语文本输入EvenGRU和OddGRU,根据如下公式,得到角色嵌入REi

其中,i为上下文话语文本的序号,cn为上下文话语文本;

将词嵌入序列e、所述对话上下文话语间注意力表示Oc和所述角色嵌入REi输入至所述解码器层,计算词汇表中词的输出概率,输出概率最大的词。

2.根据权利要求1所述的一种能感知对话上下文相对位置信息的多轮对话文本生成方法,其特征在于,将所述上下文话语间注意力表示Oc和所述对话响应的注意力表示OR输入至所述隐变量层,计算得到隐变量l,包括:

将所述上下文话语间注意力表示Oc和所述对话响应的注意力表示OR连接在一起,通过激活函数tanh馈入一个两层前馈网络;

对前馈网络的输出进行线性变换来定义后验均值μposterior

对前馈网络的输出进行不同的线性变换;

使用softplus函数定义后验协方差矩阵∑posterior

利用公式Pθ(l|u0,...,un-1)=N(μposterior,∑posterior),从多变量正态分布N(μ,∑)中采样隐变量1。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学;广东农工商职业技术学院,未经华南师范大学;广东农工商职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110575909.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top