[发明专利]用户意图识别方法、装置、计算机设备及存储介质在审
申请号: | 202210597087.X | 申请日: | 2022-05-30 |
公开(公告)号: | CN114943226A | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 罗欢;张炫;侯元春;陈超 | 申请(专利权)人: | 上海喜马拉雅科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F16/335;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 张欣欣 |
地址: | 201100 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 意图 识别 方法 装置 计算机 设备 存储 介质 | ||
1.一种用户意图识别方法,其特征在于,所述方法包括:
获取多个标准问题文本和多个用户输入序列;
基于每个所述标准问题文本的意图标签对每个所述标准问题文本进行处理,得到训练样本集;
基于每个所述用户输入序列对应的被点击意图对每个所述用户输入序列进行处理,得到测试样本集;
利用所述训练样本集,训练多种预先建立的用户意图识别模型,得到多种训练后的用户意图识别模型;
利用所述测试样本集,评价每种训练后的用户意图识别模型,并根据评价结果从多种训练后的用户意图识别模型中确定最终的用户意图识别模型,以对用户每次输入的文本进行意图识别。
2.如权利要求1所述的方法,其特征在于,基于每个所述标准问题文本的意图标签对每个所述标准问题文本进行处理,得到训练样本集的步骤包括:
针对所述多个标准问题文本中的任意一个目标文本,将所述目标文本拆分为多个语素;
将所述多个语素进行多次组合,得到多个子文本,其中,每个所述子文本均包括至少一个语素,每个所述语素在任意一个所述子文本中的位置与在所述目标文本中的位置相同;
将每个所述子文本均关联所述目标文本对应的意图标签,得到所述目标文本对应的训练样本组;
遍历每个所述标准问题文本,得到所述训练样本集,所述训练样本集包括每个所述标准问题文本对应的训练样本组。
3.如权利要求1所述的方法,其特征在于,所述用户输入序列包括多个输入文本,每个所述输入文本均是用户在两次输入停顿间输入的文本,所述多个输入文本按照用户输入的顺序排列;
所述基于每个所述用户输入序列对应的被点击意图对每个所述用户输入序列进行处理,得到测试样本集的步骤包括:
针对所述多个用户输入序列中的任意一个目标序列,对所述目标序列的所有输入文本进行多次组合,得到多个用户问题文本,其中,每个所述用户问题文本均包括至少一个输入文本,每个所述输入文本在任意一个所述用户问题文本中的位置与用户输入的顺序相同;
将每个所述用户问题文本均关联所述目标序列对应的被点击意图,得到所述目标序列对应的测试样本组;
遍历每个所述用户输入序列,得到所述测试样本集,所述测试样本集包括每个所述用户输入序列对应的测试样本组。
4.如权利要求1所述的方法,其特征在于,所述测试样本集包括多个测试样本组;
所述利用所述测试样本集,评价每种训练后的用户意图识别模型的步骤包括:
针对任意一种训练后的用户意图识别模型,分别将每个所述测试样本组输入训练后的用户意图识别模型进行测试,得到每个所述测试样本组对应的测试结果;
根据所有所述测试样本组对应的测试结果,计算训练后的用户意图识别模型的预设指标的值,所述预设指标表征训练后的用户意图识别模型在对用户的意图进行识别时的成功率和速率;
遍历每种训练后的用户意图识别模型,得到每种训练后的用户意图识别模型的预设指标的值,以完成对每种训练后的用户意图识别模型的评价。
5.如权利要求4所述的方法,其特征在于,所述测试结果包括正向样本量,所述正向样本量表征所述测试样本组中通过测试的测试样本数据的个数,所述预设指标包括识别成功率指标;
所述根据所有所述测试样本组对应的测试结果,计算训练后的用户意图识别模型的预设指标的值的步骤包括:
计算所有所述测试样本组的正向样本量之和与所述测试样本组的总个数的比值;
将所述比值作为训练后的用户意图识别模型的所述识别成功率指标的值。
6.如权利要求5所述的方法,其特征在于,所述测试样本组中的每个测试样本数据均设置了序号,所述预设指标还包括识别速率指标,所述方法还包括:
针对每个所述正向样本量不为0的所述测试样本组,将所述测试样本组中通过测试的测试样本数据的最小序号作为目标序号;
针对每个所述正向样本量为0的所述测试样本组,将所述测试样本组中测试样本数据的最大序号作为目标序号;
计算所有所述测试样本组的目标序号之和与所述测试样本组的总个数的比值;
将所述比值作为训练后的用户意图识别模型的所述识别速率指标的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海喜马拉雅科技有限公司,未经上海喜马拉雅科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210597087.X/1.html,转载请声明来源钻瓜专利网。