[发明专利]多轮对话的情绪识别模型训练方法、装置、设备及介质有效
申请号: | 202110694285.3 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113297366B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 陆凯 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06F40/30;G06F18/214 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 吴英铭 |
地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 轮对 情绪 识别 模型 训练 方法 装置 设备 介质 | ||
1.一种多轮对话的情绪识别模型训练方法,其特征在于,包括:
获取包含多个情绪标注的预设对话训练文本;所述预设对话训练文本为多轮对话中生成的具有上下文关系的对话句;
按照预设分组规则将所述预设对话训练文本分成第一训练组和第二训练组;
对所述第一训练组中的文本划分序列得到语义符号序列、说话人序列和token type序列;所述第一训练组包括待预测句子、待预测句子的说话人信息、上下文和上下文的说话人列表;
所述对所述第一训练组中的文本划分序列得到语义符号序列和说话人序列,包括:
根据预设开头语义符号和预设结尾语义符号分别对所述待预测句子开头位置和结尾位置进行分割;
根据所述预设结尾语义符号对所述上下文的开头位置和结尾位置进行分割;
将所述待预测句子和所述上下文的对话句中除开头位置和结尾位置之外的位置作为词语位置,将所述词语位置对应的词语确定为语义符号;
根据所述预设开头语义符号、预设结尾语义符号和确定的语义符号生成语义符号序列;
获取所述待预测句子的说话人信息和所述上下文的说话人列表,根据所述说话人信息和所述上下文的说话人列表在所述待预测句子和所述上下文的对话句中的每一个词语位置、开头位置和结尾位置标记说话人符号,并将所述说话人符号构成的序列作为所述说话人序列;
将所述第一训练组的语义符号序列、说话人序列和token type序列全部输入至Bert模型后,得到所述第一训练组的整体语义向量和位置语义向量;
根据所述第二训练组、所述第一训练组的整体语义向量和位置语义向量计算总损失值,根据总损失值与目标总损失值之间的差值关系更新所述Bert模型的参数,若更新参数后的Bert模型对应的总损失值小于或等于所述目标总损失值,将更新参数后的Bert模型记录为已训练成功的情绪识别模型。
2.根据权利要求1所述的多轮对话的情绪识别模型训练方法,其特征在于,所述对所述第一训练组中的文本划分序列得到token type序列,包括:
随机选取一个所述第一训练组中的待预测句子作为目标待预测句子,将所述目标待预测句子中所有词语位置、开头位置和结束位置对应的语义符号作为待预测部分,并将所述待预测部分对应的token type设置为第一序列值;
选取所述上下文中的对话句,并将所述对话句中所有词语位置、开头位置和结尾位置的语义符号作为参考部分,并将所述参考部分对应的token type设置为第二序列值;
将所述第一序列值和第二序列值构成的序列作为所述token type序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110694285.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多屏拼接的集成成像3D图像配准方法
- 下一篇:一种剥线工具