[发明专利]基于域的影响评分有效

专利信息
申请号: 201810061246.8 申请日: 2018-01-23
公开(公告)号: CN108376146B 公开(公告)日: 2022-03-18
发明(设计)人: S·K·S·古玛兰 申请(专利权)人: 苹果公司
主分类号: G06F16/2457 分类号: G06F16/2457;G06F16/903;G06F16/951;G06F16/9535
代理公司: 中国贸促会专利商标事务所有限公司 11038 代理人: 吴信刚
地址: 美国加*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 影响 评分
【说明书】:

本发明涉及基于域的影响评分。本发明描述了创建可用于对搜索结果进行排名或排序的域影响分数的方法和系统。在一个实施方案中,域影响评分系统通过预选该域的子组并将初始影响分数分配给仅子组中的域,而所有其他域具有为零的初始影响分数而开始。然后对到页面的链接进行计数,以更新每个域的影响分数。此外,可使用一个或多个黑名单来修改影响分数的更新。

专利申请要求2017年1月30日提交的美国临时专利申请62/452,239的权益,该专利申请以引用方式并入本文。

背景技术

通常情况下,搜索存储在一个或多个数据处理系统中的信息会在搜索结果中产生非常大的一组项目。例如,在互联网上搜索信息(例如使用Bing或Yahoo或Google进行的web搜索)通常产生在搜索结果中包括成千上万项目(例如网页)的搜索结果列表。为了使搜索结果对用户更有帮助,用于返回搜索结果的数据处理系统将基于使该列表以特定次序显示项目(例如网页)的排名或分数对结果进行排名或排序。用于对搜索结果中的项目进行排序的项目分数可基于提供该项目的域的影响分数,并且结果中的每个项目可具有用于对搜索结果内的项目进行排名或排序的影响分数。用于返回搜索结果的系统使用基于对到域的链接的分析而开发的这些影响分数。通过以下方法来开发影响分数:为提供项目诸如网页的域的语料库中的每个域指定默认的最小影响分数,然后基于到域的链接的数量来更新默认的最小分数。在更新影响分数的过程期间,链接到或指向另一域的域将贡献或捐赠其影响分数的一部分给另一域。更新影响分数的最终结果产生数据集,其中所有域具有正(非零)影响分数,其中一些域具有比其他域显著更高的影响分数。

发明内容

在一个实施方案中,创建影响分数的过程可通过仅为所有域的子组初始化域影响评分系统而开始;具体地讲,可通过将预先确定的初始影响分数分配给子组中的每个域(并且可手动将这些域选择为重要的“可信”域)来初始化该系统,而所有其他域具有为零的初始影响分数。例如,如果子组中存在100个域(其中每个域都被挑选为重要的可信域),则这100个域中的每个域将被初始化具有为0.01的初始影响分数(IS),而所有其他数百万的域将被初始化具有为0.0的初始IS。在该初始化之后,可使用已知算法以基于从第一域中的一个网页到第二域中的网页的链接来更新所有域的影响分数;这些算法可“捐赠”或贡献第一域的影响分数的一部分给第二域。为大多数域设置初始IS=0的结果是:这些域(其具有初始IS=0)仅可通过来自得到或具有非零IS的域的“捐赠”或贡献来得到非零IS。

一个实施方案中用于创建可用于对搜索结果进行排名的域影响分数的方法可包括以下操作:获得由一组域托管的页面的语料库,这些页面中的至少一些页面包括到其他页面的链接;通过将预先确定的初始影响分数(诸如一组一个或多个预先确定的初始影响分数)分配给该组域中的域的预选子组中的每个域来初始化域影响评分系统,使得预选子组中的每个域通过具有大于零的预先确定的初始影响分数来开始用于导出更新的影响分数的过程,而所有其他域通过具有零初始影响分数来开始该过程;并通过对到语料库中的页面的链接进行计数来更新所有域的初始分数。在一个实施方案中,页面可以是网页,并且该组域中的域可通过由实体拥有或控制的一组网址或统一资源标识符(URI)限定。在一个实施方案中,语料库可通过抓取互联网以获得并存储该语料库。在一个实施方案中,每个页面可以是在指定的URI处的分立的一组内容,并且基于特征诸如可信度和/或重要性等,可至少部分地通过人为选择或判断来预选域的预选子组。在一个实施方案中,不在该预选子组中的其他域仅通过来自得到或具有非零影响分数的域的链接来获取非零影响分数值。在一个实施方案中,影响分数的更新创建可被保存并用于对搜索结果进行排名或排序的最终影响分数。

在一个实施方案中,方法还可包括生成域的黑名单,其中在更新所有域的影响分数的过程期间使用该黑名单,并且该黑名单包括列入黑名单的域的列表。更新影响分数的过程可包括考虑到来往于列入黑名单的域的链接以便计算未列入黑名单的其他域的影响分数的技术。例如,在一个实施方案中,在更新影响分数的过程期间,从列入黑名单的域到另一域的链接不增加另一域的影响分数。在另一个实施方案中,在更新影响分数的过程期间,从未列入黑名单的域到列入黑名单的域的链接导致负分被添加到未列入黑名单的域的影响分数值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810061246.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top