[发明专利]用于管理列表的系统和方法无效
申请号: | 200680015894.5 | 申请日: | 2006-03-10 |
公开(公告)号: | CN101203847A | 公开(公告)日: | 2008-06-18 |
发明(设计)人: | 亚当·海德;桑迪普·康纳;约瑟夫·廷 | 申请(专利权)人: | 雅虎公司 |
主分类号: | G06F17/00 | 分类号: | G06F17/00;G06F17/30 |
代理公司: | 中原信达知识产权代理有限责任公司 | 代理人: | 穆德骏;黄启行 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 管理 列表 系统 方法 | ||
1.一种计算机系统,用于管理对于通过数据网络从多个源捕捉的列表信息数据的捕捉和处理,从而将所述列表信息数据编译为可搜索的数据结构,所述系统包括:
管理入口模块,通过网络接口提供系统管理和操作控制;以及
一个或多个列表管理器模块,响应经由所述管理入口模块提供的指令,操作用于:控制对于所述源的访问;控制列表信息数据的检索并且处理从所述源接收到的所述列表信息数据;对所述列表信息数据进行分类;检查所述分类的列表信息数据的部分是否符合预定质量标准;以及将所述分类的列表信息数据存储在搜索区中以供使用。
2.根据权利要求1所述的系统,其中,所述数据网络是因特网。
3.根据权利要求1所述的系统,其中,每个列表管理器模块包括一个或多个任务管理器,所述每个任务管理器包括:
抓取管理模块,协调一个或多个抓取引擎的操作以及这些抓取引擎之间的通信,以从由所述管理入口模块中的站点管理模块识别的站点获得抓取的数据集,并且将所述抓取的数据集存储在数据库中;以及
质量管理模块,连接到所述抓取管理模块,分析存储在所述数据库中的每个抓取数据集是否符合预定的质量标准。
4.根据权利要求3所述的系统,其中每个任务管理器模块进一步包括:
列表数据分类模块,操作用于对在所述数据库中存储的每个数据集进行检查并将所述数据集分类到一个或多个类别的预定集中,并且将分类的数据集返回到所述数据库;以及
搜索区同步器,与所述数据库通信,用于对来自所述数据库的分类的数据集进行编译并将其传送到所述搜索区中。
5.根据权利要求1所述的系统,其中,所述分类模块包括:
分类数据库;以及
文档分类平台服务,通过将每个抓取的数据集的文本与在所述分类数据库中的之前分类的列表数据文本进行比较,来为每个抓取的列表信息数据集确定在每个预定类别中的置信值。
6.根据权利要求4所述的系统,其中,所述管理入口包括分类查看模块,所述分类查看模块允许查看者来核实由所述文档分类平台服务确定的分类。
7.根据权利要求4所述的系统,其中,返回到所述数据库的每个数据集包括由所述分类模块确定的分配类别以及用于该类别的分配置信值。
8.根据权利要求7所述的系统,其中,返回到所述数据库的每个数据集进一步包括每个预定类别的置信值。
9.根据权利要求5所述的系统,其中,如果所述分配置信值低于预定阈值,则返回到所述数据库的每个数据集包括手动查看标记设置。
10.根据权利要求1所述的系统,其中,所述质量管理模块与不满足预定标准的每个数据集相关联地设置质量标记。
11.根据权利要求10所述的系统,其中,所述管理入口进一步包括质量查看模块,所述质量查看模块与所述质量管理模块通信,并允许查看者来手动地检查已经设置了所述质量标记的数据集。
12.一种获得、处理和编译列表数据集的方法,包括:
从通过因特网可访问的一个或多个站点上的一个或多个列表,获得列表信息数据集;
将与每个列表对应的数据集存储在数据库中;
分析所述数据库中存储的每个数据集是否符合预定质量标准;以及
将存储在所述数据库中的每个数据集分类到一个或多个预定的类别中,并将所述分类后的数据集返回到所述数据库。
13.根据权利要求12所述的方法,进一步包括通过XML提要从一个或多个客户站点获得列表信息数据集。
14.根据权利要求12所述的方法,其中,所述分类操作进一步包括:
对每个预定类别的每个数据集分配置信值。
15.根据权利要求12所述的方法,其中,所述分类操作包括:
将每个获得的数据集的文本与在分类数据库中的之前分类的数据集的文本进行比较;以及
为每个获得的数据集确定在每个预定类别中的置信值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雅虎公司,未经雅虎公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680015894.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:癌症治疗剂
- 下一篇:用于辅助车辆驾驶的装置和用于使该装置运转的方法