[发明专利]面向软件项目的多源异构数据自动收集方法及系统有效
申请号: | 201710301051.1 | 申请日: | 2017-05-02 |
公开(公告)号: | CN107220297B | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 邹艳珍;倪际楠;曹英魁;谢冰;赵俊峰 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955;G06F9/48;G06F9/50 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 余功勋 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供面向软件项目的多源异构数据自动收集方法及系统,该系统包括:多任务多线程爬取模块,用于对多个数据爬取任务进行统一的调度,并对不同类型的数据实现不同的爬取方法,以根据不同数据类型的数据入口地址自动调用不同的爬取方法对不同类型的数据爬取任务进行数据爬取;多源异构软件项目数据自动收集模块,用于根据用户输入的软件项目名称及URL自动化探测该软件项目数据的数据类型及其对应的数据入口地址,并根据已知的不同数据类型的数据入口地址创建其对应的数据爬取任务,在所述多任务多线程爬取模块中调用不同的爬取方法对数据进行收集;数据解析存储模块,用于对上述收集的数据进行解析并存储到数据库中。 | ||
搜索关键词: | 面向 软件 项目 多源异构 数据 自动 收集 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710301051.1/,转载请声明来源钻瓜专利网。