[发明专利]模型训练方法和装置及人工智能对话的识别方法和装置在审
申请号: | 202011588096.X | 申请日: | 2020-12-29 |
公开(公告)号: | CN112735431A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 袁兆卫 | 申请(专利权)人: | 三星电子(中国)研发中心;三星电子株式会社 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L25/63;G10L25/24;G10L15/16;G10L25/30 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 孙清然;王琦 |
地址: | 210012 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 人工智能 对话 识别 | ||
1.一种模型训练方法,其特征在于,包括:
获取真人语音对话语料;
遍历所述真人语音对话语料中的每轮对话数据,基于该轮对话数据,生成训练样本,并基于所述训练样本,构建真人对话训练样本集合和机器对话训练样本集合;其中,每个所述训练样本集合包括文本训练样本、语音训练样本和情感训练样本;
利用所述训练样本,分别对人工智能对话识别模型中的文本判别器、语音判别器和情感检测器进行训练;
利用所述训练样本集合,对所述人工智能对话识别模型的权重概率计算层进行训练,得到所述人工智能对话识别模型中用于计算最终识别概率的概率权重参数;所述概率权重参数包括所述文本判别器、所述语音判别器和所述情感检测器各自对应的概率权重参数。
2.根据权利要求1所述的方法,其特征在于,所述对所述人工智能对话识别模型的权重概率计算层进行训练包括:
将所述训练样本集合Sk中的文本训练样本,输入至所述文本判别器处理,得到对话对象为机器的第一概率;
将所述训练样本集合Sk中的语音训练样本,输入至所述语音判别器处理,得到语音来源为机器的第二概率;
将所述训练样本集合Sk中的情感训练样本,输入至所述情感检测器处理,得到训练样本携带每种预设情感的情感概率,并基于香农信息熵和所述情感概率,得到语音来源为机器的第三概率;
利用所述文本判别器、所述语音判别器和所述情感检测器各自对应的概率权重参数,对所述第一概率、所述第二概率和所述第三概率进行加权计算,得到第四概率,将所述第四概率作为所述人工智能对话识别模型本次训练的最终识别概率;
根据所述第四概率和所述训练样本集合Sk对应的期望值,对所述概率权重参数进行反馈调整。
3.根据权利要求2所述的方法,其特征在于,所述基于香农信息熵和所述情感概率,得到语音来源为机器的第三概率包括:
基于所述情感概率,计算得到香农信息熵H(X);其中,P(x)表示训练样本携带第x种情感的情感概率;N表示情感种类数量;
基于所述H(X),计算P3=H(X)/Hmax(X),得到所述第三概率P3;其中,所述Hmax(X)表示情感种类数量为N时的最大香农信息熵。
4.根据权利要求3所述的方法,其特征在于,所述情感包括:
悲伤、愤怒、惊奇、恐惧、喜悦、仇恨和/或平静。
5.根据权利要求1所述的方法,其特征在于,所述文本训练样本的生成包括:
将一轮对话数据转化为文本数据;
从所述文本数据中提取出对话双方各自对应的文本特征序列ot和rt;
将所述文本数据中与所述特征序列ot对应的文本数据,输入至人工智能AI对话生成器,得到与所述特征序列ot对应的机器人对话特征序列rt';
基于所述文本特征序列ot和rt,构建第一文本训练样本,并加入相应对话数据的真人对话训练样本集合;所述第一文本训练样本包括序列[ot:rt]和期望值参数y=0;y表示对话对象为机器的概率;
基于所述文本特征序列ot和rt',构建第二文本训练样本,并加入相应对话数据的机器对话训练样本集合;所述第二文本训练样本包括序列[ot:rt']和期望值参数y=1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子(中国)研发中心;三星电子株式会社,未经三星电子(中国)研发中心;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011588096.X/1.html,转载请声明来源钻瓜专利网。