[发明专利]一种搜索建议词生成的方法以及装置有效
申请号: | 201310485782.8 | 申请日: | 2013-10-16 |
公开(公告)号: | CN103544266B | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 崔代超 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 赵娟 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 建议 生成 方法 以及 装置 | ||
1.一种搜索建议词生成的方法,包括:
接收搜索字符串;
将所述搜索字符串映射为一个或多个第一分词;
获取一个或多个与所述第一分词相关联的关联第二分词;所述关联第二分词与所述第一分词的同现率高于预设阈值;所述同现率为所述一个或多个第一分词与所述第二分词同时出现在一个预置索引表中的概率,分为一个第一分词与第二分词的同现率,和/或多个第一分词与第二分词的同现率;所述预置索引表包括所述第一分词所属的网页标题,以及,每个网页标题对应的第二分词;
依据所述一个或多个第一分词与所述一个或多个关联第二分词组合成一个或多个搜索建议词;
推送所述一个或多个搜索建议词,进一步包括:将所述搜索建议词按序插入预设的建议系统中,由所述建议系统推送所述搜索建议词。
2.如权利要求1所述的方法,其特征在于,所述获取一个或多个与所述第一分词相关联的关联第二分词的步骤包括:
将抓取到的包含所述第一分词的多个网页标题进行分词,得到分词列表;
将所述分词列表中除所述第一分词外的一个或多个其余分词作为第二分词;
分别计算所述一个或多个第一分词与所述第二分词的同现率;
提取所述同现率高于预设阈值的第二分词作为关联第二分词。
3.如权利要求1所述的方法,其特征在于,所述将所述搜索字符串映射为一个或多个第一分词的步骤包括:
提取所述搜索字符串所映射的一个第一分词;
或者,
当接收到的搜索字符串为复合词时,将所述搜索字符串拆分为多个搜索子词;
提取所述多个搜索子词所映射的多个第一分词。
4.如权利要求2所述的方法,其特征在于,所述计算所述一个或多个第一分词与所述第二分词的同现率的步骤包括:
当所述搜索字符串被映射为一个第一分词时,提取所述第一分词对应的预置索引表;
分别获取每个预置索引表中各个第二分词出现的次数,以及所述索引表的记录总数;
分别计算所述第二分词出现的次数与所述索引表的记录总数的比值,得到所述第一分词与各个第二分词的同现率。
5.如权利要求2所述的方法,其特征在于,所述计算所述一个或多个第一分词与所述第二分词的同现率的步骤包括:
当所述搜索字符串被映射为多个第一分词时,分别提取所述多个第一分词对应的多个预置索引表;
提取与所述多个第一分词同时出现的第二分词作为候选分词;
分别计算各个索引表中所述第一分词与所述候选分词的同现率,所述同现率为所述索引表中各个候选分词出现的次数与所述索引表中的记录总数的比值;
分别为所述多个第一分词与所述各个候选分词的同现率配置对应的多个权重;
分别计算多个配置了权重的同现率的平均值,作为所述多个第一分词与所述候选分词的同现率。
6.如权利要求2所述的方法,其特征在于,所述计算所述一个或多个第一分词与所述第二分词的同现率的步骤包括:
当所述搜索字符串被映射为多个第一分词时,分别提取所述多个第一分词对应的多个预置索引表;
采用所述多个索引表确定主分词,所述主分词为记录总数最多的索引表对应的第一分词;
计算所述主分词与其对应的索引表中各个第二分词的同现率,所述同现率为所述索引表中各个第二分词出现的次数与所述索引表中的记录 总数的比值。
7.如权利要求1所述的方法,其特征在于,所述依据所述一个或多个第一分词与所述一个或多个关联第二分词组合成一个或多个搜索建议词的步骤包括:
为所述一个或多个关联第二分词配置权重;
按照所述权重对所述一个或多个关联第二分词进行排序;
依次组合所述排序的一个或多个关联第二分词与所述一个或多个第一分词,生成一个或多个搜索建议词。
8.如权利要求7所述的方法,其特征在于,所述为所述一个或多个关联第二分词配置权重的步骤包括:
获取所述每个关联第二分词所属的一个或多个网页标题对应的网页时效与网页热度;
按照所述网页时效与所述网页热度为所述一个或多个关联第二分词配置权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310485782.8/1.html,转载请声明来源钻瓜专利网。