[发明专利]基于混合协同过滤的第三方库推荐方法在审
申请号: | 202010298379.4 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111538846A | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 李兵;陈健;王健;赵玉琦;姚力;熊燚铭 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/9536;G06F40/295;G06F40/30;G06N3/08 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 李丹 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 混合 协同 过滤 第三 推荐 方法 | ||
本发明公开了一种基于混合协同过滤的第三方库推荐方法,包括以下步骤:根据已发布的应用和第三方库数据获得应用和第三方库的特征训练数据集;使用无监督学习方法训练得到主题模型;从应用和第三方库数据中抽取实体构建知识图谱并向量化;将待推荐应用数据输入到主题模型生成应用近邻列表;利用应用对第三方库的调用信息得到待推荐应用基于内容的评分列表;将待推荐应用和待推荐第三方库列表输入到知识图谱得到实体向量列表;计算实体向量的相似度得到待推荐应用基于知识图谱的评分列表;融合后进行排序得到基于混合推荐的推荐列表。本发明的混合推荐方法,来规避单一推荐方法的缺陷,在有效解决数据稀疏和冷启动问题的同时,提升推荐的准确率。
技术领域
本发明涉及计算机技术,尤其涉及一种基于混合协同过滤的第三方库推荐方法。
背景技术
随着互联网技术的飞速发展,软件及应用已经成为人们日常生活中不可或缺的一部分。第三方库在应用的开发过程中发挥了至关重要的作用。它们可以缩短开发时间,提高开发效率并提高开发质量。但是,随着第三方库的迅速增加,即使对于有经验的开发人员,选择合适的第三方库也是一项耗时且费力的工作。如何从大量复杂的第三方库中选择满足需求的库,成为应用程序开发中的一个难题。推荐系统能够有效地改善信息过载的问题,广泛应用于网络中的诸多场景。当前第三方库的推荐方法主要有基于内容的推荐方法和基于协同过滤的推荐方法,这些方法存在如下问题:
1、基于内容的推荐方法,是根据内容发现第三方库和应用之间的相似性,然后基于应用的内容来给应用推荐相似的第三方库。该方法能够有效地处理冷启动问题和数据稀疏问题,并且具有很好的可解释性,但是该方法无法推荐具有潜在调用关系的第三方库,而且第三方库的特征选择、抽取和匹配是难点。
2、基于协同过滤的推荐方法,是先找到与待推荐应用相似的一些应用,然后把这些应用调用的而待推荐应用未调用的第三方库推荐给该应用。由于这种将应用聚类的方式需要利用应用的历史第三方库调用信息,所以存在数据稀疏和冷启动问题。
发明内容
本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种基于混合协同过滤的第三方库推荐方法。
本发明解决其技术问题所采用的技术方案是:一种基于混合协同过滤的第三方库推荐方法,包括以下步骤:
1)从应用和第三方库服务器中获取已发布的应用和第三方库数据;所述应用和第三方库数据包括应用和第三方库的文本描述信息、应用对第三方库的调用信息以及应用和第三方库自身的结构化语义信息;
2)将步骤1)中应用和第三方库的文本描述信息通过自然语言处理方法进行预处理并向量化,得到应用和第三方库的基于内容的特征训练数据集;
3)将步骤2)中应用和第三方库的基于内容的特征训练数据集作为语料库,使用无监督学习方法训练得到应用和第三方库的主题模型;
4)将步骤1)中应用对第三方库的调用信息按每个应用对每个第三方库调用关系构建应用对第三方库的调用交互矩阵;
5)从步骤1)所得的应用和第三方库自身的结构化语义信息中抽取出实体及实体间的关系,保存到图数据库中形成知识图谱;
6)利用知识图谱表示学习方法将步骤5)所得的知识图谱映射到一个低维空间得到每个实体和关系的向量化表示;
7)获取待推荐的应用的文本描述信息和其自身的结构化信息;
8)将步骤7)得到的待推荐应用的文本描述信息输入到步骤3)得到的主题模型,通过文本描述信息的相似度比较,得到待推荐应用基于内容的近邻列表;
9)根据待推荐应用基于内容的近邻列表对于待推荐第三方库的调用交互信息,利用协同过滤方法按相似度进行加权求和取均值,得到待推荐应用对于待推荐第三方库基于内容的评分列表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010298379.4/2.html,转载请声明来源钻瓜专利网。