[发明专利]改进购物搜索引擎有效
申请号: | 201110117329.2 | 申请日: | 2011-04-11 |
公开(公告)号: | CN102508831A | 公开(公告)日: | 2012-06-20 |
发明(设计)人: | S·P·坎杜利;M·D·巴洛斯;M·帕拉欣;C·郁;Q·吴 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 蔡悦 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 改进 购物 搜索引擎 | ||
1.一种在因特网搜索中所使用的计算机上显示按相关性排名的结果的方法,所述方法包括:
生成查询集(302);
在因特网搜索引擎上执行所述查询集中的每一个查询以开发对应的结果集(304);
从每一对应的结果集中选择有限数量的文档(306);
为所述有限数量的文档中的每一个文档开发相对于主观准则的主观评级(308);
至少部分地使用所述有限数量的文档中的每一个文档的主观评级来对机器学习分类工具进行编程(310);
执行返回文档集的查询(352);
使用所述机器学习分类工具来为所述文档集的至少一部分生成绝对相关性分数(356);
从所述文档集的至少一部分创建文档子集,所述文档子集中的每一文档具有超过阈值的其相应的绝对相关性分数(358);
基于所述文档子集中的文档的特征来选择一个或多个相关细化(362);
在所述计算机上显示所述一个或多个相关细化(364);以及
基于所述文档子集的每一文档的绝对相关性分数、按与所述查询的最高相关性的次序来在所述计算机上显示所述文档子集(366)。
2.如权利要求1所述的方法,其特征在于,为所述有限数量的文档中的每一个文档开发所述主观评级包括从相对于所述主观准则对所述有限数量的文档中的每一个文档进行评级的多个审判员中的每一个接收所述主观评级。
3.如权利要求2所述的方法,其特征在于,还包括:
基于所述主观评级计算审判员间一致率(312);以及
当所述审判员间一致率落在一限制以下时警告所述多个审判员(314)。
4.如权利要求2所述的方法,其特征在于,开发所述主观评级包括所述多个审判员中的每一个分配差、一般、好、以及完美评级中的一个。
5.如权利要求4所述的方法,其特征在于,每一评级被分配一数值,每一对应评级的值指数地增加。
6.如权利要求1所述方法,其特征在于,从每一对应的结果集中选择所述有限数量的文档包括选择由相对排名器指定的前20个文档以及选自由所述相对排名器指定的排名为21-250的文档中的另外80个文档。
7.如权利要求1所述的方法,其特征在于,选择一个或多个相关细化包括选择特性和特征中的至少一个,其中所述特性包括用户评级,以及所述特征包括分类、价格、以及品牌。
8.如权利要求1所述的方法,其特征在于,对所述机器学习分类工具进行编程包括对多重累计回归树(MART)工具进行编程。
9.如权利要1所述的方法,其特征在于,生成所述查询集包括从实际用户搜索查询的搜索引擎日志中选择所述查询集。
10.如权利要求1所述的方法,其特征在于,还包括:
开发与所述文档集的至少一部分相关的提升的特征;
基于经提升的特征来为所述文档集的至少一部分的每一文档重新生成绝对相关性分数;以及
用经重新生成的绝对相关性分数来重新创建所述文档子集。
11.如权利要求1所述的方法,其特征在于,还包括基于相对排名过程从所述文档集中选择所述文档集的至少一部分。
12.一种用于为从因特网搜索查询返回的文档提供按绝对相关性排名的结果的系统,包括:
web服务器,所述web服务器接收因特网搜索销售相关的查询;
搜索引擎服务器,所述搜索引擎服务器执行对应于销售相关的查询的搜索,并且返回多个响应文档;
分类工具服务器,所述分类工具服务器使用加权的树搜索来为所述多个响应文档中的至少某些开发绝对相关性排名;
内容服务器,所述内容服务器从所述多个响应文档中的具有在阈值以上的其相应的绝对相关性排名的至少某些文档中提取所选择的文档,并且自动地生成包括至少一产品分类的相关内容;
分类工具编程环境,所述分类工具编程环境包括分类工具开发服务器、分类工具数据库、以及支持人类评级审判员的多个工作站。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110117329.2/1.html,转载请声明来源钻瓜专利网。