[发明专利]基于SVM分类模型的用户查询信息及意图提取方法及装置有效
申请号: | 202010600199.7 | 申请日: | 2020-06-29 |
公开(公告)号: | CN111488451B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 杨贻宏 | 申请(专利权)人: | 上海飞旗网络技术股份有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/332;G06F16/35;G06K9/62 |
代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 杨俊华 |
地址: | 200120 上海市浦东新区自由贸*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 svm 分类 模型 用户 查询 信息 意图 提取 方法 装置 | ||
1.一种基于SVM分类模型的用户查询信息及意图提取方法,其特征在于,应用于搜索引擎,所述方法包括:
获取终端设备发送的多个关键词以及所述终端设备的设备标识;
将每个关键词输入预先训练完成的SVM分类模型进行计算,得到每个关键词对应的类别分组以及所述类别分组下的多个目标关键词;
确定每个类别分组下的每个目标关键词的关键词标识,根据所述关键词标识将每个类别分组进行关联,得到多个查询主题信息;
提取每个查询主题信息的第一词向量;从预设的运行日志中确定与所述设备标识对应的目标查询记录,并提取目标查询记录的第二词向量;
计算每个第一词向量与所述第二词向量之间的相似度,将最大相似度对应的查询主题信息确定为目标主题信息;
基于所述目标主题信息进行搜索,并将搜索结果回传给所述终端设备;
其中,从预设的运行日志中确定与所述设备标识对应的目标查询记录,具体包括:
获取所述运行日志中包括的携带有所述设备标识的多个初始查询记录;
在预设的信息数据库中查询是否存在所述初始查询记录的反馈信息;其中,所述反馈信息在所述终端设备接收到初始查询记录时反馈给所述预设的信息数据库;
若存在所述反馈信息,将所述反馈信息对应的初始查询记录确定为所述设备标识对应的目标查询记录。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
计算所述目标主题信息和预设主题信息之间的词向量相似度;
判断所述词向量相似度是否超过设定阈值;
若所述词向量相似度超过所述设定阈值,则向所述终端设备发送提示信息,以提示所述终端设备基于所述提示信息与目标设备进行通讯。
3.如权利要求1或2所述的方法,其特征在于,确定每个类别分组下的每个目标关键词的关键词标识,根据所述关键词标识将每个类别分组进行关联,得到多个查询主题信息,包括:
确定每个目标关键词的词性信息以及所述词性信息对应的上游词性信息和下游词性信息;
在每个类别分组下查找与每个目标关键词相对应的上游词性信息对应的上游关键词以及与每个目标关键词相对应的下游词性信息对应下游关键词;
将每个目标关键词及其对应的上游关键词和下游关键词进行关联得到所述查询主题信息。
4.如权利要求1所述的方法,其特征在于,计算每个第一词向量与所述第二词向量之间的相似度,将最大相似度对应的查询主题信息确定为目标主题信息,包括:
针对每个第一词向量,计算该第一词向量与每个目标查询记录对应的第二词向量之间的相似度,并计算该第一词向量对应的多个相似度的平均值;
将计算得到的最大平均值对应的第一词向量的查询主题信息确定为目标主题信息。
5.一种基于SVM分类模型的用户查询信息及意图提取装置,其特征在于,应用于搜索引擎,所述装置包括:
信息获取模块,用于获取终端设备发送的多个关键词以及所述终端设备的设备标识;
分类计算模块,用于将每个关键词输入预先训练完成的SVM分类模型进行计算,得到每个关键词对应的类别分组以及所述类别分组下的多个目标关键词;
主题获得模块,用于确定每个类别分组下的每个目标关键词的关键词标识,根据所述关键词标识将每个类别分组进行关联,得到多个查询主题信息;
向量提取模块,用于提取每个查询主题信息的第一词向量;从预设的运行日志中确定与所述设备标识对应的目标查询记录,并提取目标查询记录的第二词向量;
主题确定模块,用于计算每个第一词向量与所述第二词向量之间的相似度,将最大相似度对应的查询主题信息确定为目标主题信息;
信息搜索模块,用于基于所述目标主题信息进行搜索,并将搜索结果回传给所述终端设备;
其中,所述向量提取模块,具体用于:
获取所述运行日志中包括的携带有所述设备标识的多个初始查询记录;
在预设的信息数据库中查询是否存在所述初始查询记录的反馈信息;其中,所述反馈信息在所述终端设备接收到初始查询记录时反馈给所述预设的信息数据库;
若存在所述反馈信息,将所述反馈信息对应的初始查询记录确定为所述设备标识对应的目标查询记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海飞旗网络技术股份有限公司,未经上海飞旗网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010600199.7/1.html,转载请声明来源钻瓜专利网。