[发明专利]用户意图识别方法、装置、计算机设备及存储介质在审

专利信息
申请号: 202210597087.X 申请日: 2022-05-30
公开(公告)号: CN114943226A 公开(公告)日: 2022-08-26
发明(设计)人: 罗欢;张炫;侯元春;陈超 申请(专利权)人: 上海喜马拉雅科技有限公司
主分类号: G06F40/289 分类号: G06F40/289;G06F40/216;G06F16/335;G06K9/62
代理公司: 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人: 张欣欣
地址: 201100 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用户 意图 识别 方法 装置 计算机 设备 存储 介质
【说明书】:

发明的实施例提供了一种用户意图识别方法、装置、计算机设备及存储介质,涉及计算机技术领域。首先,获取多个标准问题文本和多个用户输入序列;然后,基于每个标准问题文本的意图标签对每个标准问题文本进行处理,得到训练样本集,基于每个用户输入序列对应的被点击意图对每个用户输入序列进行处理,得到测试样本集;接着,利用训练样本集,训练多种预先建立的用户意图识别模型,得到多种训练后的用户意图识别模型;最后,利用测试样本集,评价每种训练后的用户意图识别模型,并根据评价结果从多种训练后的用户意图识别模型中确定最终的用户意图识别模型,以对用户每次输入的文本进行意图识别,进而有效地解决用户的问题,提升用户体验。

技术领域

本发明涉及计算机技术领域,具体而言,涉及一种用户意图识别方法、装置、计算机设备及存储介质。

背景技术

现有的用户意图识别方法主要是基于检索方式,利用人工设置的关键词、关键词权重、停用词、同义词、不可拆分词,通过模糊匹配来实现,在用户输入的问题文本较为完整时,现有方法是能较为准确的识别用户的意图的。而对于用户输入的问题文本不完整的情况,即用户只输入了部分关键信息,忽略了一些能够定位问题的语素,由于现有方法往往只考虑了词信息,而没有考虑到语义信息,在这种情况下,现有方法的应用效果较差,用户意图识别的准确性较低,不能有效地解决用户的问题,影响用户体验。

发明内容

为了克服现有技术的不足,本发明实施例提供了一种用户意图识别方法、装置、计算机设备和计算机可读存储介质,其能够在用户输入的问题文本不完整的情况下,准确识别用户的意图,从而有效地解决用户的问题,提升用户体验。

本发明的实施例可以这样实现:

第一方面,本发明提供一种用户意图识别方法,所述方法包括:

获取多个标准问题文本和多个用户输入序列;

基于每个所述标准问题文本的意图标签对每个所述标准问题文本进行处理,得到训练样本集;

基于每个所述用户输入序列对应的被点击意图对每个所述用户输入序列进行处理,得到测试样本集;

利用所述训练样本集,训练多种预先建立的用户意图识别模型,得到多种训练后的用户意图识别模型;

利用所述测试样本集,评价每种训练后的用户意图识别模型,并根据评价结果从多种训练后的用户意图识别模型中确定最终的用户意图识别模型,以对用户每次输入的文本进行意图识别。

在可选的实施方式中,基于每个所述标准问题文本的意图标签对每个所述标准问题文本进行处理,得到训练样本集的步骤包括:

针对所述多个标准问题文本中的任意一个目标文本,将所述目标文本拆分为多个语素;

将所述多个语素进行多次组合,得到多个子文本,其中,每个所述子文本均包括至少一个语素,每个所述语素在任意一个所述子文本中的位置与在所述目标文本中的位置相同;

将每个所述子文本均关联所述目标文本对应的意图标签,得到所述目标文本对应的训练样本组;

遍历每个所述标准问题文本,得到所述训练样本集,所述训练样本集包括每个所述标准问题文本对应的训练样本组。

在可选的实施方式中,所述用户输入序列包括多个输入文本,每个所述输入文本均是用户在两次输入停顿间输入的文本,所述多个输入文本按照用户输入的顺序排列;

所述基于每个所述用户输入序列对应的被点击意图对每个所述用户输入序列进行处理,得到测试样本集的步骤包括:

针对所述多个用户输入序列中的任意一个目标序列,对所述目标序列的所有输入文本进行多次组合,得到多个用户问题文本,其中,每个所述用户问题文本均包括至少一个输入文本,每个所述输入文本在任意一个所述用户问题文本中的位置与用户输入的顺序相同;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海喜马拉雅科技有限公司,未经上海喜马拉雅科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210597087.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top