[发明专利]提供搜索联想词的方法、装置、存储介质及电子设备在审
申请号: | 201811024818.1 | 申请日: | 2018-09-04 |
公开(公告)号: | CN110019650A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 郑海贵;邵荣防;郝晖;欧阳硕 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F16/953;G06F3/023 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 袁礼君;阚梓瑄 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索词 联想词 搜索 关联索引 备选 搜索字符串 电子设备 目标搜索 排序分数 字符串 数据库 计算机可读存储介质 普遍适用性 存储介质 开发效率 排序 开发 | ||
1.一种提供搜索联想词的方法,其特征在于,包括:
从搜索词数据库中获取搜索词,并获取用于联想所述搜索词的至少一个搜索字符串;
建立所述搜索词与所述搜索字符串之间的关联索引,并计算所述关联索引的排序分数Sp;
从所述搜索词数据库中获取与一目标搜索字符串存在关联索引关系的至少一个备选搜索词;
将所述备选搜索词按照所述排序分数Sp进行排序,并将有序排列的所述备选搜索词作为所述目标搜索字符串的搜索联想词。
2.根据权利要求1所述的提供搜索联想词的方法,其特征在于,所述计算所述关联索引的排序分数Sp,包括:
根据所述搜索词与所述搜索字符串的关联程度,计算所述关联索引的相关度分数Sx;
根据所述相关度分数Sx计算所述关联索引的排序分数Sp。
3.根据权利要求2所述的提供搜索联想词的方法,其特征在于,所述计算所述关联索引的相关度分数Sx,包括:
分别获取所述搜索词的词向量以及所述搜索字符串的词向量;
计算所述搜索词的词向量与所述搜索字符串的词向量之间的向量距离,并将所述向量距离作为所述关联索引的相关度分数Sx。
4.根据权利要求3所述的提供搜索联想词的方法,其特征在于,分别获取所述搜索词的词向量以及所述搜索字符串的词向量,包括:
获取所述搜索词以及所述搜索字符串在训练语料库中的上下文词语;
以所述上下文词语作为输入数据,利用神经网络算法分别训练得到所述搜索词的词向量以及所述搜索字符串的词向量。
5.根据权利要求2所述的提供搜索联想词的方法,其特征在于,所述根据所述相关度分数Sx计算所述关联索引的排序分数Sp,包括:
利用预设搜索接口获取所述搜索词的搜索结果数;
根据所述搜索结果数计算所述搜索词的质量分数Sz;
根据所述质量分数Sz和所述相关度分数Sx计算所述关联索引的排序分数Sp。
6.根据权利要求5所述的提供搜索联想词的方法,其特征在于,在根据所述质量分数Sz和所述相关度分数Sx计算所述关联索引的排序分数Sp之前,所述根据所述相关度分数Sx计算所述关联索引的排序分数Sp还包括:
对所述质量分数Sz做归一化处理。
7.根据权利要求5所述的提供搜索联想词的方法,其特征在于,所述根据所述质量分数Sz和所述相关度分数Sx计算所述关联索引的排序分数Sp,包括:
根据公式Sp=Sz*a+Sx*b计算所述排序分数Sp;其中,Sz为所述质量分数,Sx为所述相关度分数,a为第一预设系数,b为第二预设系数。
8.根据权利要求7所述的提供搜索联想词的方法,其特征在于,所述第一预设系数为0.6,所述第二预设系数为0.4。
9.根据权利要求5所述的提供搜索联想词的方法,其特征在于,所述从搜索词数据库中获取搜索词,包括:
获取与搜索对象的基本信息相关的基本信息数据库,以所述基本信息数据库作为所述搜索词数据库;
从所述基本信息数据库中获取所述搜索词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811024818.1/1.html,转载请声明来源钻瓜专利网。