[发明专利]多轮对话的情绪识别模型训练方法、装置、设备及介质有效

申请号：	202110694285.3	申请日：	2021-06-22
公开（公告）号：	CN113297366B	公开（公告）日：	2023-05-30
发明（设计）人：	陆凯	申请（专利权）人：	中国平安人寿保险股份有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/33;G06F16/35;G06F40/30;G06F18/214
代理公司：	深圳众鼎专利商标代理事务所(普通合伙) 44325	代理人：	吴英铭
地址：	518000 广东省深圳市福田区益田路5033号***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	轮对情绪识别模型训练方法装置设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及分类模型的技术领域，揭露了一种多轮对话的情绪识别模型训练方法、装置、设备及介质。本发明提供的方法包括：获取包含多个情绪标注的预设对话训练文本；将预设对话训练文本分成第一训练组和第二训练组；根据第一训练组生成语义符号序列、说话人序列和token type序列；将语义符号序列、说话人序列和token type序列全部输入至Bert模型后，得到输出的整体语义向量和位置语义向量；根据第二训练组、整体语义向量和位置语义向量计算总损失值，根据总损失值更新Bert模型的参数，若更新参数后的Bert模型对应的总损失值小于或等于目标总损失值，将更新参数后的Bert模型记录为情绪识别模型。本发明能够在不同说话人的多轮对话中精准识别出对话句的情绪类别。

技术领域

本发明涉及分类模型的技术领域，尤其揭露了一种多轮对话的情绪识别模型训练方法、装置、设备及介质。

背景技术

目前，在对话中区分不同说话人的信息，对于与该对话相关的下游任务是很重要的，例如，在情绪识别的过程中，一个人的情绪自己往往具有连贯性，而自己的情绪也容易受到对方的影响，如A在对话中的情绪是消极，而对方B是积极，那么A在后续对话中，情绪可能会变的积极，因此在情绪识别模型的建模过程中，对说话人的对话进行语义理解且区分不同说话人的信息是非常重要的。

现有技术中，可以训练BERT模型来作为情绪识别模型，其中，BERT模型是在普通文本上做的预训练，但普通文本中的句子和对话中的句子有着明显的不同，两者主要的不同之处在于对话中的句子是由不同的说话人说出的，此时需要区分不同说话人的信息，而普通的文本不需要考虑不同说话人的信息。因此普通文本根本实现不了连续性对话中的情绪识别。

同时，一个对话中往往有两个及以上的说话人参与，但现有的BERT模型不具备区分不同说话人的能力，使得现有的BERT模型在用于对话相关的任务时存在明显缺陷问题：不能对不同说话人的信息进行建模，进而不能区分不同说话人的信息，且对情绪识别造成一定的影响。因此本领域人员亟需寻找一种新的技术方案来实现不同说话人在多轮对话中的情绪识别。

发明内容

基于此，有必要针对上述技术问题，提供一种多轮对话的情绪识别模型训练方法、装置、设备及介质，能够在不同说话人参与的多轮对话中精确识别出对话句的情绪类别。

一种多轮对话的情绪识别模型训练方法，包括：

获取包含多个情绪标注的预设对话训练文本；所述预设对话训练文本为多轮对话中生成的具有上下文关系的对话句；

按照预设分组规则将所述预设对话训练文本分成第一训练组和第二训练组；

对所述第一训练组中的文本划分序列得到语义符号序列、说话人序列和tokentype序列；

将所述第一训练组的语义符号序列、说话人序列和token type序列全部输入至Bert模型后，得到所述第一训练组的整体语义向量和位置语义向量；

根据所述第二训练组、所述第一训练组的整体语义向量和位置语义向量计算总损失值，根据总损失值与目标总损失值之间的差值关系更新所述Bert模型的参数，若更新参数后的Bert模型对应的总损失值小于或等于所述目标总损失值，将更新参数后的Bert模型记录为已训练成功的情绪识别模型。

一种多轮对话的情绪识别模型训练装置，包括：

获取模块，用于获取包含多个情绪标注的预设对话训练文本；所述预设对话训练文本为多轮对话中生成的具有上下文关系的对话句；

分组模块，用于按照预设分组规则将所述预设对话训练文本分成第一训练组和第二训练组；

生成模块，用于对所述第一训练组中的文本划分序列得到语义符号序列、说话人序列和token type序列；