[发明专利]代码推荐方法和装置在审
申请号: | 202010562667.6 | 申请日: | 2020-06-19 |
公开(公告)号: | CN111723192A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 许静;过辰楷;杨卉;张青峰 | 申请(专利权)人: | 南开大学;天津给智信息技术股份有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F8/41;G06K9/62 |
代理公司: | 北京布瑞知识产权代理有限公司 11505 | 代理人: | 李浩 |
地址: | 300350 天津*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 代码 推荐 方法 装置 | ||
1.一种代码推荐方法,其特征在于,包括:
将多个待选数据输入训练好的分类模型,得到与多个所述待选数据一一对应的多个分类,其中,多个所述待选数据用于表征多个候选代码和用户代码的内容;
根据与多个所述待选数据一一对应的多个所述分类,获取与多个所述分类一一对应的多个分类相似度值;以及
根据所述多个分类相似度值,从所述多个候选代码中获取推荐代码。
2.根据权利要求1所述的代码推荐方法,其特征在于,所述根据所述多个分类相似度值,从所述多个候选代码中获取推荐代码包括:根据所述多个分类相似度值和初步相似度值的和,从所述多个候选代码中获取推荐代码;
其中,所述根据所述多个分类相似度值和初步相似度值的和,从所述多个候选代码中获取推荐代码之前还包括:
根据多个所述候选代码和所述用户代码,得到与多个所述候选代码一一对应的多个初步相似度值;以及
将与多个所述候选代码一一对应的多个所述初步相似度值和多个所述分类相似度值分别相加,得到与多个所述候选代码一一对应的所述多个分类相似度值和初步相似度值的和。
3.根据权利要求2所述的代码推荐方法,其特征在于,所述将多个待选数据输入训练好的分类模型之前还包括:
对多个原始候选代码进行特征提取,得到与所述多个原始候选代码对应的所述多个原始候选代码的特征矩阵;
对所述用户代码进行特征提取,得到与所述用户代码对应的所述用户代码的特征向量;
将所述多个原始候选代码的所述特征矩阵与所述用户代码的所述特征向量相乘,得到所述多个原始候选代码与所述用户代码的初步相似度向量,其中,所述相似度向量包含与所述多个原始候选代码一一对应的多个相似度向量元素值;以及
提取与所述多个原始候选代码一一对应的多个所述相似度向量元素值大于预设阈值的代码,得到多个候选代码。
4.根据权利要求3所述的代码推荐方法,其特征在于,所述根据多个所述候选代码和所述用户代码,得到与多个所述候选代码一一对应的多个初步相似度值包括:
提取与多个所述候选代码一一对应的多个相似度向量元素值;以及将与多个所述候选代码一一对应的多个所述相似度向量元素值进行归一化处理,得到与多个所述候选代码一一对应的多个所述初步相似度值。
5.根据权利要求3所述的代码推荐方法,其特征在于,所述将多个待选数据输入训练好的分类模型之前还包括:
在项目集平台收集多个项目;以及
提取多个所述项目中每个所述项目的多个类文件,得到所述多个原始候选代码。
6.根据权利要求5所述的代码推荐方法,其特征在于,所述在项目集平台收集多个项目包括:
在项目集平台收集多个关注度大于预设数值的项目。
7.根据权利要求1所述的代码推荐方法,其特征在于,所述将多个待选数据输入训练好的分类模型之前包括:
使用训练集对所述分类模型进行训练,得到训练好的所述分类模型;
其中,所述使用训练集对所述分类模型进行训练,得到训练好的所述分类模型之前包括:
对代码数据集中的多个代码进行抽象语法树结点提取,得到所述代码数据集中的所述多个代码的抽象语法树;以及
将所述多个代码的抽象语法树分别进行词向量转化,得到多个用于表征所述代码数据集的内容的所述训练集。
8.根据权利要求1所述的代码推荐方法,其特征在于,所述将多个待选数据输入训练好的分类模型之前还包括:
对多个代码集分别进行抽象语法树结点提取,得到所述多个代码集的抽象语法树,其中,多个所述代码集用于表征多个所述候选代码内容和用户代码内容的集合;以及
将所述多个代码集的抽象语法树进行词向量转化,得到用于表征多个所述候选代码内容的多个所述待选数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学;天津给智信息技术股份有限公司,未经南开大学;天津给智信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010562667.6/1.html,转载请声明来源钻瓜专利网。