[发明专利]一种用户意图识别方法、装置、服务器和介质有效
申请号: | 202010632031.4 | 申请日: | 2020-07-03 |
公开(公告)号: | CN111832305B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 申众;张又亮;张崇宇 | 申请(专利权)人: | 北京小鹏汽车有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/211;G06F40/30;G10L15/22 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 意图 识别 方法 装置 服务器 介质 | ||
1.一种用户意图识别方法,其特征在于,包括:
获取用户查询语句,以及获取文本图;所述文本图包括句子节点、词节点和连接句子节点和词节点的边;所述句子节点记录有已标注有用户意图的参考语句和所述参考语句的特征向量;所述词节点记录有从所述参考语句中抽取出来的参考关键词;所述边记录有表征所述参考关键词对于所述参考语句的重要程度的权重值;
从记录在所述句子节点的参考语句中,选取候选参考语句;所述候选参考语句包含与从所述用户查询语句提取的查询关键词匹配的目标参考关键词;
根据记录在所述边中的所述目标参考关键词对于所述候选参考语句的权重值,确定所述候选参考语句的权重得分;
确定所述用户查询语句的特征向量,并采用所述用户查询语句的特征向量和记录在所述句子节点中的所述候选参考语句的特征向量,确定所述候选参考语句与所述用户查询语句的相似度;
根据所述候选参考语句的权重得分和所述候选参考语句与所述用户查询语句的相似度,从所述候选参考语句中选取目标参考语句;
将所述目标参考语句的用户意图作为所述用户查询语句的用户意图。
2.根据权利要求1所述的方法,其特征在于,所述文本图通过如下步骤生成:
获取已标注有用户意图的参考语句,并从所述参考语句提取参考关键词;
将所述参考语句输入预训练模型,并获得所述预训练模型输出的特征向量;
采用所述参考语句构建对应的句子节点,并在所述句子节点记录所述参考语句、所述参考语句的用户意图和特征向量;
计算表征所述参考关键词对于所述参考语句的重要程度的权重值;
采用所述参考关键词构建对应的词节点,并在所述词节点与对应的句子节点之间建立边,将所述边的权重值设置为表征所述参考关键词对于所述参考语句的重要程度的权重值。
3.根据权利要求1所述的方法,其特征在于,所述从记录在所述句子节点的参考语句中,选取候选参考语句,包括:
从所述文本图的词节点中,确定记录有与所述查询关键词匹配的目标参考关键词的目标词节点;
从对应所述目标词节点的句子节点所记录的参考语句中,选取候选参考语句。
4.根据权利要求1所述的方法,其特征在于,所述确定所述用户查询语句的特征向量,包括:
将所述候选参考语句输入预训练模型,并获得所述预训练模型输出的特征向量。
5.根据权利要求1所述的方法,其特征在于,所述根据所述候选参考语句的权重得分和所述候选参考语句与所述用户查询语句的相似度,从所述候选参考语句中选取目标参考语句,包括:
采用所述候选参考语句的权重得分和所述候选参考语句与所述用户查询语句的相似度,计算第一得分;
采用所述第一得分进行排序;
按照排序结果,选取目标参考语句。
6.根据权利要求1所述的方法,其特征在于,所述将所述目标参考语句的用户意图作为所述用户查询语句的用户意图,包括:
计算表征所述查询关键词对于所述用户查询语句的重要程度的权重值;
采用所述表征所述查询关键词对于所述用户查询语句的重要程度的权重值与所述目标参考语句,计算第二得分;
判断所述第二得分是否大于预设得分阈值;
若所述第二得分大于所述预设得分阈值,则将所述目标参考语句的用户意图作为所述用户查询语句的用户意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小鹏汽车有限公司,未经北京小鹏汽车有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010632031.4/1.html,转载请声明来源钻瓜专利网。