[发明专利]模型的训练方法、装置、计算机设备和可读存储介质在审
申请号: | 201910002486.5 | 申请日: | 2019-01-02 |
公开(公告)号: | CN111401071A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 刘昊;于静磊 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/33;G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 计算机 设备 可读 存储 介质 | ||
1.一种模型的训练方法,其特征在于,所述方法用于意图识别模型,所述方法包括以下步骤:
获取目标意图;所述目标意图是对对话上文进行意图识别得到的;
根据所述目标意图,查询与所述目标意图匹配的设定回复;
确定所述匹配的设定回复与对话下文之间的语义相似度;所述对话下文接续在所述对话上文之后;
若所述语义相似度大于设定相似度阈值,采用所述目标意图对所述对话上文进行标注得到第一正样本,以使所述意图识别模型根据所述第一正样本进行意图训练。
2.根据权利要求1所述的训练方法,其特征在于,所述获取目标意图,包括:
将所述对话上文输入所述意图识别模型,采用所述意图识别模型进行意图识别,以使所述意图识别模型输出所述目标意图,以及输出所述目标意图的置信度;
所述根据所述目标意图,查询与所述目标意图匹配的设定回复,包括:
若确定所述置信度大于置信度阈值,查询意图与回复之间的对应关系,得到与所述目标意图匹配的设定回复。
3.根据权利要求2所述的训练方法,其特征在于,所述获取所述意图识别模型输出的所述目标意图的置信度之后,还包括:
若确定所述置信度小于或等于所述置信度阈值,将所述对话上文添加到待标注列表中,以对所述待标注列表进行人工意图识别。
4.根据权利要求1所述的训练方法,其特征在于,所述确定所述匹配的设定回复与对话下文之间的语义相似度之后,还包括:
若确定所述语义相似度小于或等于所述设定相似度阈值,将所述对话上文添加到所述待标注列表中,以对所述待标注列表进行人工意图识别。
5.根据权利要求3或4所述的训练方法,其特征在于,所述将所述对话上文添加到待标注列表中,以对所述待标注列表进行人工意图识别之后,还包括:
获取所述对话上文的人工意图识别结果;
采用所述人工意图识别结果对所述对话上文进行标注得到第二正样本,以使所述意图识别模型根据所述第二正样本进行意图训练。
6.根据权利要求1-4任一项所述的训练方法,其特征在于,所述确定所述匹配的设定回复与对话下文之间的语义相似度,包括:
获取所述匹配的设定回复的语义向量;
获取所述对话下文的语义向量;
计算所述匹配的设定回复的语义向量与所述对话下文的语义向量之间的语义相似度。
7.根据权利要求1-4任一项所述的训练方法,其特征在于,所述获取目标意图之前,还包括:
获取对话语音;
对所述对话语音进行识别,得到所述对话上文。
8.一种模型的训练装置,其特征在于,所述装置用于意图识别模型,所述装置包括:
获取模块,用于获取目标意图;所述目标意图是对对话上文进行意图识别得到的;
查询模块,用于根据所述目标意图,查询与所述目标意图匹配的设定回复;
确定模块,用于确定所述匹配的设定回复与对话下文之间的语义相似度;所述对话下文接续在所述对话上文之后;
标注模块,用于若所述语义相似度大于设定相似度阈值,采用所述目标意图对所述对话上文进行标注得到第一正样本,以使所述意图识别模型根据所述第一正样本进行意图训练。
9.一种计算机设备,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-7中任一所述的模型的训练方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的模型的训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910002486.5/1.html,转载请声明来源钻瓜专利网。