[发明专利]在搜索结果排序中对垃圾的检测有效
申请号: | 201180027027.4 | 申请日: | 2011-04-19 |
公开(公告)号: | CN102918532A | 公开(公告)日: | 2013-02-06 |
发明(设计)人: | V·坦科维奇;D·梅耶泽;V·波兹南斯基 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F9/44 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈斌 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 各实施例涉及使用垃圾简档来排序搜索结果。对于给定文档语料库,可以创建和维护一个或多个垃圾简档。垃圾简档提供了表示已知的垃圾文档的参考度量。例如,垃圾简档可以包括自动地插入到使用特定系统或模板创建的文档中的文档数据的词典。垃圾简档还可以包括已知垃圾文档的特定垃圾变量的分布的一个或多个表示(例如,直方图)。垃圾简档提供已知垃圾文档的可使用的表示,本系统和方法使用垃圾简档来预测语料库中的文档是垃圾的可能性。在各实施例中,计算垃圾分数,并响应于搜索查询,将其用于将这样的文档排序得高一些或低一些。 | ||
搜索关键词: | 搜索 结果 排序 垃圾 检测 | ||
【主权项】:
一种用于响应于搜索查询来对候选文档进行排序的计算机实现的方法,包括下列步骤:由至少第一处理器,创建语料库中的多个文档的索引;使用垃圾简档,计算所述语料库中的至少第一文档的垃圾分数;接收搜索查询;基于所述搜索查询和所述索引,从所述语料库中的所述多个文档中标识候选文档,其中,所述候选文档包括至少所述第一文档;对所述候选文档进行排序。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201180027027.4/,转载请声明来源钻瓜专利网。