[发明专利]一种面向开放域对话系统的情感回复自动生成方法在审

申请号：	202010634898.3	申请日：	2020-07-03
公开（公告）号：	CN111782788A	公开（公告）日：	2020-10-16
发明（设计）人：	刘梦娟;包笑明;赵培;罗莉娟;杨云帆	申请（专利权）人：	电子科技大学
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/33;G06F40/30
代理公司：	暂无信息	代理人：	暂无信息
地址：	611731 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种面向开放对话系统情感回复自动生成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种面向开放域对话系统的情感回复自动生成方法，其特征在于，包括以下步骤：

步骤1：构建对话语料库，对语料库中的输入-回复对(X,Y)进行分词处理，得到输入和回复语句的词序列X和Y；

步骤2：基于预训练得到的词嵌入表，将输入和回复语句的词序列分别映射为词嵌入向量e_X和e_Y；基于人为制定的VAD情感字典，将输入和回复句子的词序列分别映射为情感嵌入向量a_X和a_Y；

步骤3：将输入语句的词嵌入向量和情感嵌入向量按每个词语进行拼接，得到拼接后的表示向量{e_X a_X}；将回复语句的词嵌入向量和情感嵌入向量按每个词语进行拼接，得到拼接后的表示向量{e_Y a_Y}；

步骤4：将输入和回复语句拼接后的表示向量{e_X a_X}和{e_Y a_Y}，分别输入到输入编码器EncoderX和回复编码器EncoderY中，得到输入和回复的语义表示向量c_X和c_Y；

步骤5：通过语义表示向量c_X预测条件先验概率P(z|X,A_X)，P(z|X,A_X)表示在数据X和A_X出现的情况下潜变量z的概率分布，这里A_X表示输入X的情感信息；通过语义表示向量c_X和c_Y预测后验概率P(z|X,A_X,Y,A_Y)的近似，P(z|X,A_X,Y,A_Y)表示在数据X和A_X，以及后验数据Y和A_Y同时出现的情况下潜变量z的概率分布，这里A_Y表示回复Y的情感信息；使用重参数化的技巧从条件先验分布和后验分布的近似中分别采样潜变量z'和z；

步骤6：使用潜变量z和输入语句的语义表示向量c_X初始化解码器，顺序解码得到每个时刻t，模型对词汇表V中每个词语预测的生成概率Y′_t＝{p₁,p₂,...,p_|V|}；

步骤7：计算重构真实回复中每个词语VAD值时的情感损失，计算重构真实回复中每个词语时的NLL(Negative Log-Likelihood)损失，计算条件先验分布和识别网络预测的真实后验分布的近似之间的KL(Kullback-Leibler)散度损失，将三部分损失加权求和作为最终的损失，并使用KL退火训练回复生成模型；

步骤8：对于一个新的用户输入语句，执行1-5步中对输入语句的处理，从条件先验分布中采样C个潜变量z'，对于C个潜变量都执行一次步骤6，在每个时刻t选择生成概率最大的词语作为当前时刻t的输出，从而产生C个候选回复；

步骤9：使用三个评分器主要从生成回复的语法、语义、情感三个方面对C个候选回复评分，并从C个候选回复中选择一个合适的回复作为模型最终输出的回复。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于电子科技大学，未经电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010634898.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种具有可调液位无源自动补水止水机构的密闭容器
下一篇：图像处理装置、图像处理装置的控制方法和存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种面向开放域对话系统的情感回复自动生成方法在审

专利文献下载