[发明专利]一种基于知识图谱的开源应用自动化推荐方法及装置有效
申请号: | 202211140949.2 | 申请日: | 2022-09-20 |
公开(公告)号: | CN115221310B | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 孙艳春;黄罡;马郓 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F8/70;G06F16/33;G06F16/35;G06F16/36;G06F40/30;G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苟冬梅 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 应用 自动化 推荐 方法 装置 | ||
1.一种基于知识图谱的开源应用自动化推荐方法,其特征在于,包括:
通过软件开发层级知识目录,进入目标知识条目页面;
根据所述目标知识条目页面的预设链接,获取目标开源应用;
根据开源应用知识图谱,推荐与所述目标开源应用相适应的库和框架的组合;
其中,所述开源应用知识图谱是通过如下步骤到的:
获取开源应用数据,所述开源应用数据中包括开源应用和各个所述开源应用之间的依赖关系;
利用类型识别模型,得到各个所述开源应用的类型;
根据开源应用之间的依赖关系,确定出所述开源应用中的直链项目、被依赖项目和依赖项目;
根据所述开源应用的类型,从所述直链项目、所述被依赖项目和所述依赖项目中筛选出用于构建知识图谱的候选开源应用;
以所述候选开源应用为知识图谱实体,以所述依赖关系为知识图谱关系,构建所述开源应用知识图谱。
2.根据权利要求1所述的基于知识图谱的开源应用自动化推荐方法,其特征在于,所述软件开发层级知识目录是通过如下步骤得到的,所述步骤包括:
获取分类页面数据;所述分类页面数据包括分类页面和知识条目页面;
通过规则对所述分类页面数据进行筛选;
以筛选后的所述分类页面表示分支节点,以筛选后的所述知识条目页面表示叶子节点,构建树结构的所述软件开发层级知识目录。
3.根据权利要求2所述的基于知识图谱的开源应用自动化推荐方法,其特征在于,所述知识条目页面还包括链接数据,所述步骤还包括:
根据所述链接数据,在各个知识条目页面建立对应的预设链接,以链接与所述知识条目页面对应的开源应用。
4.根据权利要求1所述的基于知识图谱的开源应用自动化推荐方法,其特征在于,所述类型识别模型是通过如下步骤建立的:
获取训练数据集,并对各个训练数据进行标注,得到标注后的训练数据集,所述标注表征所述训练数据是否为框架或库类型的开源应用;
对所述标注后的训练数据集进行预处理,得到预处理后的训练数据集;
利用所述预处理后的训练数据集进行模型训练,得到所述类型识别模型。
5.根据权利要求1所述的基于知识图谱的开源应用自动化推荐方法,其特征在于,根据开源应用知识图谱,推荐与所述目标开源应用相适应的库和框架的组合,包括:
根据开源应用知识图谱,确定所述目标开源应用的所有依赖项目;
根据开源应用知识图谱,确定出所有依赖项目的知识嵌入向量;
计算各个所述知识嵌入向量与所述目标开源应用的相似度,得到各个所述知识嵌入向量的相似度值;
根据所述相似度值,确定出多个目标依赖项目;
将所述多个目标依赖项目作为与所述目标开源应用相适应的库和框架的组合,进行推荐。
6.根据权利要求5所述的基于知识图谱的开源应用自动化推荐方法,其特征在于,根据开源应用知识图谱,确定出所有依赖项目的知识嵌入向量,包括:
根据所述开源应用知识图谱中的所述知识图谱实体和所述知识图谱关系,利用TransD模型构建所述依赖项目的知识嵌入向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211140949.2/1.html,转载请声明来源钻瓜专利网。