[发明专利]针对请求和情感标签生成的带有指定情感的机器回复方法在审

专利信息
申请号: 202210034903.6 申请日: 2022-01-13
公开(公告)号: CN114547261A 公开(公告)日: 2022-05-27
发明(设计)人: 宋丹丹;侯思琦 申请(专利权)人: 北京理工大学
主分类号: G06F16/332 分类号: G06F16/332;G06F16/35;G06F40/216;G06F40/242;G06F40/30;G06N3/04;G06N3/08
代理公司: 北京正阳理工知识产权代理事务所(普通合伙) 11639 代理人: 张利萍
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 针对 求和 情感 标签 生成 带有 指定 机器 回复 方法
【权利要求书】:

1.针对请求和情感标签生成的带有指定情感的机器回复方法,其特征在于,包括以下步骤:

步骤1:利用带情感标签的对话数据集,提取其中带有情感的句子,得到用于预训练模型的语料集,同时搜集全部语句作为正式训练语料集;计算词汇的词频-逆文本频率,用于获取主题词典,同时,获取外部情感词典;利用整体语料集,训练获取词的向量表示;

步骤2:构建预训练网络模型,用于情感打分;

预训练网络模型由长短期记忆LSTM和全连接层构成,其输出为情感分类情况,其中,情感得分score由余弦相似度计算,如式1所示:

其中,pclassify表示情感分类结果,lone-hot表示情感标签的独热向量;‖·‖表示向量·的2范数;

预训练损失函数如下式所示:

L′=L′1+L′2 (2)

L′1=(1-score) (3)

L′2=-∑jyjlog(pj) (4)

其中,L′表示预训练损失函数,L′1表示情感得分损失,L′2表示情感分类损失;pj表示数据被分到第j类的概率;yj表示实际分类结果,当数据属于j类时为1,其余情况为0;

步骤3:构建用于正式训练的损失函数;

正式训练损失函数包含以下三个部分:

一是条件变分自编码器分布之间的KL散度表示如下:

其中,KL表示KL散度计算,Pr()表示条件变分自编码器中的识别网络输出的分布,z表示隐变量,X表示输入请求,表示参考回复,Pp()表示条件变分自编码器中的先验网络输出的分布;

二是对隐变量的情感分类损失表示如下:

其中,表示在分布下的交叉熵;P(label|z)表示对隐变量z的分类结果为label的概率,label表示目标情感类别;

三是输出回复序列与参考回复序列之间的交叉熵损失表示如下:

其中,Y表示目标输出,z表示隐变量,t表示时间步,yt表示第t个时间步的输出,y表示时间步的输出;

则用于正式训练的损失函数表示如下:

其中,α为超参数,用于控制KL损失所占的权重,在训练过程中由0增至1;

步骤4:利用步骤1获取的训练数据和步骤2构建的预训练网络模型,训练得到预训练情感打分网络参数Parameterpre-train

步骤5:利用步骤1得到的训练数据、步骤3的损失函数,以及步骤4得到的预训练情感打分网络参数,训练步骤2构建的预训练网络模型;

实际运行情感对话生成应用,在没有参考回复的条件下,利用条件变分自编码器中的判别网络,生成隐变量的分布。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210034903.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top