[发明专利]面向开源社区的跨项目issue参与者推荐框架在审
申请号: | 202111390863.0 | 申请日: | 2021-11-23 |
公开(公告)号: | CN114064990A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 汪亮;江会煜;陶先平 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/9035 | 分类号: | G06F16/9035;G06F40/30;G06F40/216;G06K9/62;G06F16/901 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 王磊 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 社区 项目 issue 参与者 推荐 框架 | ||
本发明针对开源社区中issue参与者推荐局限于项目内的问题,提出了一种面向开源社区的跨项目issue参与者推荐框架,包括数据采集与文本预处理模块、关联文本语义嵌入模块、开源社区实体结构嵌入模块和推荐结果排序模块。本发明结合开源社区场景特性,利用issue的引用关系拓展项目外的开发者参与进来,利用开源社区的结构关系增强推荐的准确性和可解释性,克服了传统bug分流技术在开源社区中的不足,提高了对跨项目issue的推荐能力。此外,该框架的各部分耦合较低,其中的关联文本语义嵌入模块可拓展为通用关联文本向量嵌入算法。
技术领域
本发明属于计算机软件工程应用领域,具体涉及一种面向开源社区的跨项目issue参与者推荐框架。
背景技术
开源软件的蓬勃发展使开源社区(例如GitHub)中维护了越来越多的软件仓库,每个人都可以在公共软件仓库中提交issue,issue可以帮助开发人员发现软件漏洞,但由于数目太多致使维护人员往往无法及时检查这些issue。此外,人工查看issue并选择合适的参与者困难且乏味,而且在更大的软件仓库中这种情况会更加糟糕。
类似的问题也在bug跟踪系统(另一种开源社区,通常维护单一仓库,例如Mozilla)中出现,在bug跟踪系统中,bug分流技术将此问题视为从bug报告文本到开发者或修复者的分类问题。关于bug分类的现有工作只关注于从维护仓库的开发人员中推荐,但是在GitHub中,这个问题变得复杂,因为每个人都可以参与问题的讨论,或者提交关于这个问题的额外信息,有些人可能是专家,但并不维护此仓库。
最经典的bug分流技术已经研究了将其作为简单的文本分类问题的可能,并取得了一定的成果。但是在不限制开发者的范围下,若仍采用文本分类方法将会面临维数灾难而难以取得良好的效果。在bug分流技术方面,有研究在考虑issue到开发者的投递序列,在建立语言主题模型等方案上分别取得了各自的成功。
在开源社区中的推荐问题上,已有pull-request审阅者推荐问题从开源社区的结构上进行研究,审阅者推荐问题的研究结果表明从开源社区中各个实体的历史交互结构上预测未来关系的可能。另外,在图的边预测问题中也揭示了历史关系组成的结构的有效性。
在开源社区中,大量开源仓库中存在着交互关系,主要表现在issue之间的相互引用关系上,有研究表明跨项目的issue相比于一般issue更加难以修复,需要消耗更多的人力和时间,也有研究表明不同仓库会出现相似bug,因此某个仓库现有的issue或bug可以为其它仓库提供解决思路。这些研究都为开源社区中跨项目issue的参与者推荐问题提供了新的解决思路。
发明内容
为了克服传统bug分流技术在开源社区中的不足,提高对跨项目issue的推荐能力,本发明结合开源社区场景特性,提出一种面向开源社区的跨项目issue参与者推荐框架,利用issue的引用关系拓展项目外的开发者参与进来,利用开源社区的结构关系增强推荐的准确性和可解释性。为实现上述目的,本发明采用以下技术方案:
面向开源社区的跨项目issue参与者推荐框架,包括数据采集与文本预处理模块、关联文本语义嵌入模块、开源社区实体结构嵌入模块和推荐结果排序模块,
所述数据采集与文本预处理模块:用于从开源社区中获取信息并以一定格式加以处理,包括,去除质量差的issue和issue中的干扰部分,对issue文本进行词干提取、词形还原并去除停止词以得到issue文本集,提取每个issue对其他issue的引用关系以构建issue关系集;
所述关联文本语义嵌入模块:定义训练目标函数并利用issue文本集和issue关系集训练语义嵌入模型,通过语义嵌入模型获取待推荐issue的文本语义嵌入向量,并通过其与issue文本集中issue文本语义嵌入向量的距离找出与待推荐issue语义相似的issue集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111390863.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于区块链的数字化防伪方法
- 下一篇:智能化便携式医疗仪