[发明专利]意图识别优化处理方法、装置、设备及存储介质有效
申请号: | 202010432368.0 | 申请日: | 2020-05-20 |
公开(公告)号: | CN111611366B | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 宁泽钰;姚旭晨;方文浩;付波;冯丽芹;褚晓梅 | 申请(专利权)人: | 北京百度网讯科技有限公司;百度(美国)有限责任公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06Q30/015 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 优化 处理 方法 装置 设备 存储 介质 | ||
本申请公开了意图识别优化处理方法、装置、设备及存储介质,涉及互联网技术领域。具体方法的实现方案包括:获取第一意图集和至少一条原始语料;获取每一条原始语料的第一识别结果,其中,任意一条原始语料的第一识别结果包括利用意图识别模型识别出的该原始语料对应的第一意图;获取每一条原始语料的第二识别结果,其中,任意一条原始语料的第二识别结果包括人工识别出该原始语料对应的第二意图;根据每一条原始语料的第一识别结果和第二识别结果,对第一意图集进行优化处理,得到第二意图集,本方法具有意图分类合理,意图识别效率高,识别效果良好的有益特点。
技术领域
本申请涉及互联网技术领域,尤其是一种意图识别优化处理方法、装置、设备及存储介质。
背景技术
随着互联网技术的迅速发展,自动问答服务得到了广泛的推广和应用,其中,对获取到的语料进行意图识别是实现自动问答服务的重要内容之一。在对语料进行意图识别时,需要事先确定并提供意图集,以供意图识别模型或人工标注者在意图集中选择意图进行语料标注。
现有技术中,在利用样本数据学习得到意图集后,利用学习得到的固定的意图集供意图识别模型或人工标注者在其中选择意图进行语料标注。
然而,当学习得到的意图集的分类粒度过细或者过于模糊时,将会显著影响语料意图识别的识别效率和识别准确率,进而影响到语料标注的标注速率和标注精度。
发明内容
本申请实施例提供一种意图识别优化处理方法、装置、设备及存储介质,用于解决因意图集中意图分类粒度过细或者过于模糊造成的意图识别效率低、准确率无法保证的问题。
第一方面,本申请提供了一种意图识别优化处理方法,包括:
获取第一意图集和至少一条原始语料;
获取每一条所述原始语料的第一识别结果,其中,任意一条所述原始语料的第一识别结果包括利用意图识别模型识别出的该原始语料对应的第一意图;
获取每一条所述原始语料的第二识别结果,其中,任意一条所述原始语料的第二识别结果包括人工识别出该原始语料对应的第二意图;
根据每一条所述原始语料的所述第一识别结果和所述第二识别结果,对所述第一意图集进行优化处理,得到第二意图集。
实现了根据每一条原始语料的模型识别结果和人工标注结果,即根据每一条原始语料的预测意图和客观意图,进行第一意图集的优化,意图集优化方式可实践性高,优化参考因素多元化,利用优化得到的第二意图集进行意图识别模型时,能够有效提高意图识别模型的识别效率和识别精度。
进一步地,根据每一条所述原始语料的所述第一识别结果和所述第二识别结果,对所述第一意图集进行优化处理,得到第二意图集,包括:
根据每一条所述原始语料的所述第一识别结果和所述第二识别结果,确定所述第一意图集中的每一个意图对应的第一语料数和第二语料数;
根据所述第一意图集中的每一个意图对应的所述第一语料数和所述第二语料数,对所述第一意图集进行优化处理,得到第二意图集,
其中,确定所述第一意图集中的任意一个意图的所述第一语料数和所述第二语料数,包括:
根据每一条所述原始语料的所述第一识别结果,确定所述第一意图为该任意一个意图的原始语料的数目,构成所述第一语料数;
根据所述第一意图为该任意一个意图的每一条原始语料的所述第二识别结果,确定所述第二意图为该任意一个意图的原始语料的数目,构成所述第二语料数。
根据第一意图集中的每一个意图对应的第一语料数和第二语料数,即根据每一个意图对应的预测意图为该意图的原始语料数目,和客观意图、预测意图均为该意图的原始语料数目,对第一意图集进行优化处理,优化参考因素多样化,优化效果良好。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司;百度(美国)有限责任公司,未经北京百度网讯科技有限公司;百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010432368.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动泊车性能评价方法
- 下一篇:用于执行散列算法的电路和方法