[发明专利]一种搜索方法和系统有效

专利信息
申请号: 201210035724.0 申请日: 2012-02-16
公开(公告)号: CN102609539A 公开(公告)日: 2012-07-25
发明(设计)人: 张帆 申请(专利权)人: 北京搜狗信息服务有限公司;北京搜狗科技发展有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 苏培华
地址: 100084 北京市海淀区中关*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 搜索 方法 系统
【权利要求书】:

1.一种搜索方法,其特征在于,包括:

接收用户端输入的查询词,并获取对应的第一初始搜索结果;

利用各分类对应的强相关分类特征集合对所述第一初始搜索结果进行匹配分析,获得所述查询词与各强相关分类特征集合相应分类的相关性分析结果;所述强相关分类特征集合通过通用搜索引擎对随机词集合的搜索结果和分类词集合的搜索结果进行比较处理得到;

当所述查询词与特定分类对应的强相关分类特征集合的相关性分析结果符合判定条件时,则所述查询词与所述强相关分类特征集合相应的分类强相关,从第一初始搜索结果中提取所述分类的搜索结果并展示给用户端。

2.根据权利要求1所述的方法,其特征在于,所述强相关分类特征集合分别包括一行业类别对应的特征信息;通过如下步骤获取,包括:

获取第二初始搜索结果集合中的特征信息和第三初始搜索结果集合中的特征信息;所述第二初始搜索结果集合通过将随机词集合输入通用搜索引擎获得,所述第三初始搜索结果集合通过将初始分类词集合输入通用搜索引擎获得;

将第二初始搜索结果集合中的各特征信息的出现频率与所述特征信息在第三初始搜索结果集合中的各特征信息的出现频率进行比较分析,并将比较分析对应的特征信息存入与初始分类词集合所在分类相应的强相关分类特征集合。

3.根据权利要求2所述的方法,其特征在于:

所述特征信息包括网址和/或文本信息;所述强相关分类特征集合包括行业类别对应的网址列表和/或语言模型,对应记录所述特征信息。

4.根据权利要求3所述的方法,其特征在于,将第二初始搜索结果集合中的各特征信息的出现频率与第三初始搜索结果集合中各特征信息的出现频率进行比较分析时:

将第二初始搜索结果集合中各网址的出现频率与所述网址在所述第三初始搜索结果集合中的出现频率进行比较;当比较结果大于强需求阈值时,将所述网址存入与初始分类词集合所在分类相应的强相关分类特征集合;和/或,

将所述第二初始搜索结果集合的文本信息中各词的出现频率与所述词在所述第三初始搜索结果集合的文本信息中的出现频率进行比较,获得各词的比较值;基于所述比较值和相应的词进行处理得到与初始分类词集合所在分类相应的语言模型并存入相应的强相关分类特征集合。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

当所述比较结果小于等于强需求阈值而大于弱需求阈值时,将该网址对应的文本信息的各词在第二初始搜索结果中的出现频率与所述各词在第三初始搜索结果中的出现频率进行比较,当比较结果大于第三强相关阈值时,则将该网址存入与初始分类词集合所在分类相应的强相关分类特征集合。

6.根据权利要求3、4或5所述的方法,其特征在于,利用各分类对应的强相关分类特征集合对所述第一初始搜索结果进行匹配分析时:

将所述第一初始搜索结果中的网址与各强相关分类特征集合中的各网址进行匹配,并统计第一初始搜索结果中网址与各强相关分类特征集合匹配上的总次数;

和/或,将所述第一初始搜索结果的文本信息中的词与各强相关分类特征集合中的语言模型的词进行综合匹配。

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

当所述第一初始搜索结果中网址与一强相关分类特征集合匹配上的总次数大于第一强相关阈值时,

和/或,当所述综合匹配的结果大于第二强相关阈值时,则确认所述查询词与所述强相关分类特征集合相应的分类强相关。

8.根据权利要求6所述的方法,其特征在于,所述从第一初始搜索结果中提取所述分类的搜索结果并展示给用户端包括:

将第一初始搜索结果的各条结果逐条与强相关分类集合进行匹配,当一条搜索结果的网址属于强相关分类特征集合中网址列表,和/或,所述搜索结果的综合匹配的结果大于第二强相关阈值,则从第一初始搜索结果中提取该搜索结果;

将提取出的各搜索结果优先展示给用户端。

9.根据权利要求4所述的方法,其特征在于,所述方法还包括:

当所述查询词与各分类对应的强相关分类特征集合的相关性分析结果均不符合判定条件时,则依据各分类对应的分类词模型判断所述查询词是否属于相应分类;所述各分类对应的分类词模型基于各分类对应的强相关分类特征集合的语言模型构建。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗信息服务有限公司;北京搜狗科技发展有限公司,未经北京搜狗信息服务有限公司;北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210035724.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top