[发明专利]模型训练方法和装置及人工智能对话的识别方法和装置在审
申请号: | 202011588096.X | 申请日: | 2020-12-29 |
公开(公告)号: | CN112735431A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 袁兆卫 | 申请(专利权)人: | 三星电子(中国)研发中心;三星电子株式会社 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L25/63;G10L25/24;G10L15/16;G10L25/30 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 孙清然;王琦 |
地址: | 210012 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 人工智能 对话 识别 | ||
本申请公开了一种模型训练方法和装置及人工智能对话的识别方法和装置,其中,模型训练方法包括:获取真人语音对话语料;遍历所述真人语音对话语料中的每轮对话数据,基于该轮对话数据,生成训练样本,并基于所述训练样本,构建真人对话训练样本集合和机器对话训练样本集合;其中,每个所述训练样本集合包括文本训练样本、语音训练样本和情感训练样本;利用所述训练样本,训练人工智能对话识别模型的文本判别器、语音判别器和情感检测器;利用所述训练样本集合,对人工智能对话识别模型的权重概率计算层进行训练,得到用于计算最终识别概率的概率权重参数。采用本申请,可以对对话对象是否为人工智能机器进行准确识别。
技术领域
本发明涉及人工智能技术,特别是涉及一种模型训练方法和装置及人工智能对话的识别方法和装置。
背景技术
随着人工智能(Artificial Intelligence,AI)技术的日新月异发展,AI技术在很多领域得到广泛应用,极大提升了人们的生活质量和工作效率,同时也带来了一些风险和挑战,出现了一些对AI的恶意应用,例如AI电话欺诈、AI电话骚扰、AI短信骚扰等。为此,需要在用户使用即时通讯时(如电话、短信等)对对话方是人类还是人工智能机器进行准确识别,以使用户可以及时识别AI的恶意应用,避免这些AI的恶意应用危害用户安全。
发明内容
有鉴于此,本发明的主要目的在于提供一种识别人工智能对话的方法和装置,可以对对话对象是否为人工智能机器进行准确识别。
为了达到上述目的,本发明实施例提出的技术方案为:
一种模型训练方法,包括:
获取真人语音对话语料;
遍历所述真人语音对话语料中的每轮对话数据,基于该轮对话数据,生成训练样本,并基于所述训练样本,构建真人对话训练样本集合和机器对话训练样本集合;其中,每个所述训练样本集合包括文本训练样本、语音训练样本和情感训练样本;
利用所述训练样本,分别对人工智能对话识别模型中的文本判别器、语音判别器和情感检测器进行训练;
利用所述训练样本集合,对所述人工智能对话识别模型的权重概率计算层进行训练,得到所述人工智能对话识别模型中用于计算最终识别概率的概率权重参数;所述概率权重参数包括所述文本判别器、所述语音判别器和所述情感检测器各自对应的概率权重参数。
较佳地,所述对所述人工智能对话识别模型的权重概率计算层进行训练包括:
将所述训练样本集合Sk中的文本训练样本,输入至所述文本判别器处理,得到对话对象为机器的第一概率;
将所述训练样本集合Sk中的语音训练样本,输入至所述语音判别器处理,得到语音来源为机器的第二概率;
将所述训练样本集合Sk中的情感训练样本,输入至所述情感检测器处理,得到训练样本携带每种预设情感的情感概率,并基于香农信息熵和所述情感概率,得到语音来源为机器的第三概率;
利用所述文本判别器、所述语音判别器和所述情感检测器各自对应的概率权重参数,对所述第一概率、所述第二概率和所述第三概率进行加权计算,得到第四概率,将所述第四概率作为所述人工智能对话识别模型本次训练的最终识别概率;
根据所述第四概率和所述训练样本集合Sk对应的期望值,对所述概率权重参数进行反馈调整。
较佳地,所述基于香农信息熵和所述情感概率,得到语音来源为机器的第三概率包括:
基于所述情感概率,计算得到香农信息熵H(X);其中,P(x)表示训练样本携带第x种情感的情感概率;N表示情感种类数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子(中国)研发中心;三星电子株式会社,未经三星电子(中国)研发中心;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011588096.X/2.html,转载请声明来源钻瓜专利网。