[发明专利]检测尖峰查询有效
申请号: | 201110030893.0 | 申请日: | 2011-01-19 |
公开(公告)号: | CN102129450A | 公开(公告)日: | 2011-07-20 |
发明(设计)人: | C·A·梅耶斯;G·P·戈帕尔;A·P·奥克利;N·阿格拉沃尔;N·E·克拉斯韦尔;M·邵库赫;D·L·康奈尔;S·阿哈里;N·B·沙曼;G·萨瑞恩;H·E·威廉姆斯;J·K·高亚尔 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 蔡悦;钱静芳 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 尖峰 查询 | ||
1.一种使用具有存储器、处理器和数据存储子系统的计算系统来标识合法搜索查询尖峰的计算机实现的方法,所述计算机实现的方法包括:
从一个或多个用户输入设备接收多个搜索查询请求;
标识所接收的搜索查询请求中的一个或多个尖峰;
根据时间或文本相关性将所标识的尖峰聚类在一起;
经由所述计算系统的处理器确定接收所述搜索查询请求中的每一尖峰的加速度速率;
将所确定的聚类的所标识的尖峰的加速度速率与所存储的聚类的相似时间行为进行比较;
当所确定的加速度速率超过第一阈值水平并且与时间行为的比较低于第二阈值水平时,将所接收的搜索查询请求的特定聚类尖峰标识为恶意攻击;以及
将所接收的搜索查询请求和结果的非恶意的聚类尖峰作为一个或多个内容组存储到所述计算系统的数据存储子系统中,以供将来相关的搜索查询请求的比较和查询建议。
2.如权利要求1所述的计算机实现的方法,其特征在于,标识一个或多个尖峰包括:
确定来自对于特定参数的查询流的每一查询请求的瞬时速度,所述瞬时速度被计算为对所述特定参数的即时查询请求和最新近查询请求之间的时间差的倒数;
从对于所述特定参数的先前加权平均速度和加权瞬时速度的组合中计算经更新的加权平均速度;
将对所述特定参数的每一查询请求的瞬时加速度计算为所述经更新的加权平均速度和所述先前加权平均速度之差除以瞬时查询请求和最新近查询请求之间的时间差;以及
从对于所述特定参数的先前加权平均加速度和加权瞬时加速度的组合中确定经更新的加权平均加速度。
3.如权利要求2所述的计算机实现的方法,其特征在于,在加速度出现之前当所述加权平均速度大于基础速度,并且在出现加速度的每一瞬间所述加权平均加速度都等于或大于尖峰加速度值的一个百分比时,出现尖峰。
4.如权利要求2所述的计算机实现的方法,其特征在于,所述先前加权平均速度的第一贡献可以随着所述瞬时速度的第二贡献而改变。
5.如权利要求2所述的计算机实现的方法,其特征在于,所述先前加权平均速度和所述瞬时速度通过平均掉瞬时尖峰来标识错误尖峰。
6.如权利要求1所述的计算机实现的方法,其特征在于,所述聚类还包括将所标识的尖峰与多个相似的所存储的搜索查询结果聚类在一起。
7.如权利要求1所述的计算机实现的方法,其特征在于,所述聚类产生了减少数量的错误尖峰、改进了检测流行查询的分类准确性、并且通过比较跨多个时间段的聚类来检测季节性查询。
8.一种使用具有存储器、处理器和数据存储子系统的计算系统来产生流行搜索查询结果的计算机实现的方法,所述计算机实现的方法包括:
从用户输入设备接收搜索查询请求;
在包含所接收的搜索查询请求和其他传入搜索查询请求的查询流中标识尖峰;
作为搜索多个历史索引的结果,将所述查询流中的尖峰与来自所述历史索引的相关内容在时间上相关;
作为搜索多个新鲜索引的结果,将所述查询流中的尖峰与来自所述新鲜索引的相关内容在时间上相关,其中所述新鲜索引包含来自最近爬行的内容源的信息和结果;
经由所述计算系统的处理器确定接收所述搜索查询流中的尖峰的加速度速率;
将所确定的加速度速率与相似的所存储的搜索查询的时间行为进行比较;
经由分组的内容算法分析来自搜索所述历史索引和所述新鲜索引的结果来确定是否应该将所述搜索查询请求与现有的搜索查询结果组聚类在一起;
当加速度速率超过第一阈值水平并且与时间行为的比较低于第二阈值水平时,将所述查询流中的特定聚类尖峰标识为恶意攻击;
将所述查询流的非恶意的聚类尖峰作为一个或多个季节性图库存储到所述计算系统的数据存储子系统中;
根据所标识的聚类结果的使用期和大小来对所述搜索查询请求的结果排定优先级;以及
将所述一个或多个季节性图库和所述排定了优先级的搜索查询请求的结果传递到用户输出设备。
9.如权利要求8所述的计算机实现的方法,其特征在于,所述非恶意的聚类尖峰包括低于尖峰加速度速率的加速度速率以及在基础速度之上提高了特定百分比的平均速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110030893.0/1.html,转载请声明来源钻瓜专利网。