[发明专利]一种开源社区项目关系网络的构建方法及系统有效
申请号: | 201910729658.9 | 申请日: | 2019-08-08 |
公开(公告)号: | CN110457561A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 张莉;刘宝川;蒋竞 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955 |
代理公司: | 11386 北京天达知识产权代理事务所(普通合伙) | 代理人: | 李明里<国际申请>=<国际公布>=<进入 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种开源社区项目关系网络的构建方法及系统,属于计算机科学领域,解决了现有数据分析过程中耗时问题、编程语言的多样性问题。首先根据链接的匹配模式,从数据来源中识别链接;依次爬取数据集中每一个项目的名称,判断所述项目是否发生重定向,对于发生重定向的项目,使用变更后的项目名称;过滤项目内部的链接及不属于开源社区的链接,保留项目之间的链接;基于项目之间的链接构建项目关系网络。实现了从多种数据来源中匹配链接,完成项目关系网络的构建,增强了项目关系网络的完整性,提高了工作效率,减小了误差。 | ||
搜索关键词: | 链接 项目关系 构建 数据来源 重定向 网络 数据分析过程 多样性问题 计算机科学 编程语言 工作效率 匹配模式 数据集中 减小 社区 过滤 耗时 匹配 变更 保留 | ||
【主权项】:
1.一种开源社区项目关系网络的构建方法,其特征在于,包括以下步骤:/n确定所述开源社区中链接的数据来源,并根据链接的匹配模式,从数据来源中识别链接;/n基于包含所述链接的项目和所述链接引用的项目构建项目数据集,依次爬取数据集中每一个项目的名称,判断所述项目是否发生重定向,对于发生重定向的项目,使用变更后的项目名称;/n根据所述项目名称过滤项目内部的链接及不属于开源社区的链接,保留项目之间的链接;/n基于项目之间的链接构建项目关系网络。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910729658.9/,转载请声明来源钻瓜专利网。