[发明专利]用于语义检索的人工智能系统和方法有效
申请号: | 201811647685.3 | 申请日: | 2018-12-29 |
公开(公告)号: | CN110765368B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 余鹏;郑万吉;赵骥;陈欢;宋奇;马利 | 申请(专利权)人: | 滴图(北京)科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 杨永梅 |
地址: | 100193 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语义 检索 人工智能 系统 方法 | ||
1.一种用于语义检索的人工智能系统,其特征在于,包括:
查询词获取模块,被配置为通过数据交换端口从用户终端获取查询词;
查询词向量变换模块,被配置为使用预先生成的模型将所述查询词变换为查询词向量;
POI向量集获取模块,被配置为使用乘积量化算法,根据所述查询词向量,从检索库检索一组POI向量;以及
推荐的POI确定模块,被配置为响应于所述查询词,基于所述一组POI向量确定至少一个POI,用于向用户推荐;
还包括模型训练模块,被配置为通过以下步骤基于检索词语义与POI之间的相关性训练所述预先生成的模型:
获得初始模型;
获得至少两个历史检索词-POI对,所述至少两个历史检索词-POI对中的每一个包含一个历史查询词和相应的历史POI;
对于所述至少两个历史检索词-POI对中的每一个,
解析所述至少一个历史查询词或所述至少一个相应的历史POI到一个或以上的片段,以及
基于所述解析为所述历史检索词-POI对生成一个或以上文本表达;以及
使用深度学习方法基于所述至少两个历史检索词-POI对的所述文本表达训练所述初始模型来获得所述预先生成的模型。
2.根据权利要求1所述的系统,其特征在于,所述预先生成的模型包括深度POI语义模型DPSM模型。
3.根据权利要求1至2任一项所述的系统,其特征在于,为使用乘积量化算法,根据所述查询词向量,从检索库检索该组POI向量,所述POI向量集获取模块进一步被配置为:
获取POI数据库中至少两个POI的索引;
从所述查询词获取至少一个目标位置;以及
根据所述索引、所述查询词向量和所述至少一个目标位置,从所述检索库中确定所述一组POI向量,所述一组POI向量与所述查询词有关。
4.根据权利要求3所述的系统,其特征在于,为获取POI数据库中至少两个POI的索引,所述POI向量集获取模块进一步被配置为:
从所述POI数据库中获取所述至少两个POI;
使用所述预先生成的模型将所述至少两个POI变换为所述至少两个POI向量;以及
使用图形处理单元GPU基于所述至少两个POI向量,生成所述至少两个POI的所述索引。
5.根据权利要求1所述的系统,其特征在于,为响应于所述查询词,基于所述一组POI向量确定所述至少一个POI,用于向用户推荐,所述推荐的POI确定模块进一步被配置为:
基于所述一组POI向量生成标识符ID列表,所述ID列表包括一组ID,每个ID指向一个候选POI;
使用训练好的质检模型确定对应于所述一组POI向量的一组候选POI的一组相似值,每个相似值表示相应的POI与所述查询词的相关等级;
排序所述一组候选POI的所述相似值;以及
根据所述一组相似值的所述排序,从所述一组候选POI中确定所述至少一个POI。
6.根据权利要求5所述的系统,其特征在于,所述训练好的质检模型是梯度提升决策树GBDT模型。
7.根据权利要求5所述的系统,其特征在于,为排序所述一组候选POI的所述相似值,所述推荐的POI确定模块进一步被配置为:
对于所述一组候选POI中的每一个,确定所述对应的相似值是否大于得分阈值;
获得一个或以上相关的候选POI,其相似值大于所述得分阈值;以及
基于训练好的排序模型排序所述一个或以上相关的候选POI。
8.根据权利要求7所述的系统,其特征在于,所述训练好的排序模型是通过排序学习learn to rank方法获得的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于滴图(北京)科技有限公司,未经滴图(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811647685.3/1.html,转载请声明来源钻瓜专利网。