[发明专利]用户意图识别方法、装置、设备及计算机可读存储介质在审
申请号: | 202010110441.2 | 申请日: | 2020-02-21 |
公开(公告)号: | CN111368045A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 朱海军;许开河;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06K9/62 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 魏润洁 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 意图 识别 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种用户意图识别方法,其特征在于,所述用户意图识别方法包括以下步骤:
接收用户输入的目标问题,并将所述目标问题输入至要素识别模型,以获取与所述目标问题关联的多个历史问题;
获取各所述历史问题对应的历史要素,并对各所述历史要素进行查重处理,以获取多个相关历史要素;
依次将各所述相关历史要素和所述目标问题进行组合,以获取多个目标数据,并通过所述要素识别模型对各所述目标数据依次进行预测,以确定各所述目标数据是否符合预设要求;
将符合预设要求的目标数据中的相关历史要素作为与所述目标问题对应的目标问题要素,并基于所述目标问题要素确定所述用户的意图。
2.如权利要求1所述的用户意图识别方法,其特征在于,所述通过所述要素识别模型对各所述目标数据依次进行预测的步骤,包括:
依次遍历各所述目标数据,通过所述要素识别模型对当前遍历的目标数据进行训练,以确定所述目标问题是否包含当前遍历的所述目标数据中的相关历史要素;
若包含,则确定当前遍历的所述目标数据符合预设要求,并将当前遍历的所述目标数据中的相关历史要素作为所述目标问题对应的目标问题要素,直至各所述目标数据遍历完成。
3.如权利要求1所述的用户意图识别方法,其特征在于,所述要素识别方法,其特征在于,所述接收用户输入的目标问题,并将所述目标问题输入至要素识别模型的步骤之前,包括:
获取语言表征模型bert模型和输入的多个训练问题,并通过所述bert模型对依次对各所述训练问题进行分类训练;
将经过各分类训练完成的bert模型作为训练模型,并基于所述训练模型确定要素识别模型。
4.如权利要求3所述的用户意图识别方法,其特征在于,所述通过所述bert模型对依次对各所述训练问题进行分类训练的步骤,包括:
依次遍历各所述训练问题,确定当前遍历的训练问题中的多个标注要素,并获取与当前遍历的训练问题相关联的多个负样本数据;
基于各所述负样本数据和各所述标注要素,并通过bert模型对当前遍历的所述训练问题进行分类训练,直至各所述训练问题遍历完成。
5.如权利要求3所述的用户意图识别方法,其特征在于,所述基于所述训练模型确定要素识别模型的步骤,包括:
通过知识蒸馏对所述训练模型进行压缩,以获取压缩模型,并将所述压缩模型进行发布,以获取要素识别模型。
6.如权利要求1-5任一项所述的用户意图识别方法,其特征在于,所述获取各所述历史问题对应的历史要素,并对各所述历史要素进行查重处理,以获取多个相关历史要素的步骤,包括:
获取各所述历史问题对应的历史要素,对各所述历史要素进行查重处理,确定各所述历史要素中是否存在重复历史要素;
若不存在,则将各所述历史要素作为相关历史要素。
7.如权利要求6所述的用户意图识别方法,其特征在于,所述确定各所述历史要素中是否存在重复历史要素的步骤之后,包括:
若存在,则确定各所述重复历史要素的类型是否相同;
若不相同,则在同一类型的各所述重复历史要素中筛选一个重复历史要素作为需求历史要素,并将各所述历史要素中的非重复历史要素和所述需求历史要素作为相关历史要素,其中,各所述历史要素包括非重复历史要素和重复历史要素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010110441.2/1.html,转载请声明来源钻瓜专利网。