[发明专利]一种面向开放域对话系统的情感回复自动生成方法在审
申请号: | 202010634898.3 | 申请日: | 2020-07-03 |
公开(公告)号: | CN111782788A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 刘梦娟;包笑明;赵培;罗莉娟;杨云帆 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 开放 对话 系统 情感 回复 自动 生成 方法 | ||
1.一种面向开放域对话系统的情感回复自动生成方法,其特征在于,包括以下步骤:
步骤1:构建对话语料库,对语料库中的输入-回复对(X,Y)进行分词处理,得到输入和回复语句的词序列X和Y;
步骤2:基于预训练得到的词嵌入表,将输入和回复语句的词序列分别映射为词嵌入向量eX和eY;基于人为制定的VAD情感字典,将输入和回复句子的词序列分别映射为情感嵌入向量aX和aY;
步骤3:将输入语句的词嵌入向量和情感嵌入向量按每个词语进行拼接,得到拼接后的表示向量{eX aX};将回复语句的词嵌入向量和情感嵌入向量按每个词语进行拼接,得到拼接后的表示向量{eY aY};
步骤4:将输入和回复语句拼接后的表示向量{eX aX}和{eY aY},分别输入到输入编码器EncoderX和回复编码器EncoderY中,得到输入和回复的语义表示向量cX和cY;
步骤5:通过语义表示向量cX预测条件先验概率P(z|X,AX),P(z|X,AX)表示在数据X和AX出现的情况下潜变量z的概率分布,这里AX表示输入X的情感信息;通过语义表示向量cX和cY预测后验概率P(z|X,AX,Y,AY)的近似,P(z|X,AX,Y,AY)表示在数据X和AX,以及后验数据Y和AY同时出现的情况下潜变量z的概率分布,这里AY表示回复Y的情感信息;使用重参数化的技巧从条件先验分布和后验分布的近似中分别采样潜变量z'和z;
步骤6:使用潜变量z和输入语句的语义表示向量cX初始化解码器,顺序解码得到每个时刻t,模型对词汇表V中每个词语预测的生成概率Y′t={p1,p2,...,p|V|};
步骤7:计算重构真实回复中每个词语VAD值时的情感损失,计算重构真实回复中每个词语时的NLL(Negative Log-Likelihood)损失,计算条件先验分布和识别网络预测的真实后验分布的近似之间的KL(Kullback-Leibler)散度损失,将三部分损失加权求和作为最终的损失,并使用KL退火训练回复生成模型;
步骤8:对于一个新的用户输入语句,执行1-5步中对输入语句的处理,从条件先验分布中采样C个潜变量z',对于C个潜变量都执行一次步骤6,在每个时刻t选择生成概率最大的词语作为当前时刻t的输出,从而产生C个候选回复;
步骤9:使用三个评分器主要从生成回复的语法、语义、情感三个方面对C个候选回复评分,并从C个候选回复中选择一个合适的回复作为模型最终输出的回复。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010634898.3/1.html,转载请声明来源钻瓜专利网。