[发明专利]基于语义与语法信息融合的代码摘要生成方法及系统在审

专利信息
申请号: 202010387446.X 申请日: 2020-05-09
公开(公告)号: CN111625276A 公开(公告)日: 2020-09-04
发明(设计)人: 吕晨;高学剑;王潇;王汝芸;吕蕾;刘弘 申请(专利权)人: 山东师范大学
主分类号: G06F8/72 分类号: G06F8/72;G06N3/04;G06N3/08
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 黄海丽
地址: 250014 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语义 语法 信息 融合 代码 摘要 生成 方法 系统
【说明书】:

本公开公开了基于语义与语法信息融合的代码摘要生成方法及系统,包括:获取待生成摘要的代码;从待生成摘要的代码中分别提取图嵌入向量和节点嵌入向量;将图嵌入向量和节点嵌入向量,输入到预训练的深度学习模型中,输出代码的摘要。将代码语义和语法信息与自动摘要模型结合的方式可自动获得更高质量的代码注释和摘要,从而提高程序员的软件开发速度,具有很大的现实意义。

技术领域

本公开涉及为代码生成自然语言摘要的技术领域,特别是涉及基于语义与语法信息融合的代码摘要生成方法及系统。

背景技术

本部分的陈述仅仅是提到了与本公开相关的背景技术,并不必然构成现有技术。

伴随着互联网技术的快速发展,各大软件,系统已经快速渗透入人们的生活并在衣食住行中发挥着重大的作用,各类软件系统层出不穷,日益优化改良服务于人们的生活,在各大应用系统后的支撑性编写方式就是代码,在信息技术蓬勃发展的今天,代码容量也发生了井喷式的增长,一个小型的软件应用少则几千行代码,多则几万行。在如此庞大的代码规模下,程序员进行软件或系统的维护和优化则成了一个大问题,是否可以采用一种方法或技术,辅助程序员快速理解代码,迅速定位要优化或维护的代码段,节省其开发时间成本。这已经成为当前软件工程领域的研究热点。

在软件的开发周期中,程序员需花费60%-70%的时间去理解和浏览源代码,这是非常耗时的工作,程序员有时须将软件代码整体浏览才可确定当前代码片段的功能。为更快定位相关代码段,多数程序员一般会采取代码注释和摘要的方式,以便通过浏览注释定位和理解相关代码片段。常见添加代码注释和摘要的手段包含以下两种方式:一种是手动添加,该方法可有效提高软件后续维护和优化的效率,但其无疑增加了程序员在开发过程中的负担;另一种是使用代码自动摘要技术,该方式可以最大限度的解放程序员编写代码注释的时间,可令其更大程度的关注代码编写。目前,较为流行的代码摘要工具包括基于传统文本摘要方法和基于深度神经网络的技术。

发明人发现,传统文本摘要方法通过将代码识别成自然语言文本的形式进行处理,未能考虑到代码具有特殊的语义和语法结构,且无法大批量的处理,效果较差;现行的基于深度神经网络的方法考虑到了代码蕴含的语义信息,从而生成的代码摘要更加精确。但对于代码语法信息却没能很好的体现,因而无法获得高质量的代码摘要。

发明内容

为了解决现有技术的不足,本公开提供了基于语义与语法信息融合的代码摘要生成方法及系统;

第一方面,本公开提供了基于语义与语法信息融合的代码摘要生成方法;

基于语义与语法信息融合的代码摘要生成方法,包括:

获取待生成摘要的代码;

从待生成摘要的代码中分别提取图嵌入向量和节点嵌入向量;

将图嵌入向量和节点嵌入向量,输入到预训练的深度学习模型中,输出代码的摘要。

第二方面,本公开提供了基于语义与语法信息融合的代码摘要生成系统;

基于语义与语法信息融合的代码摘要生成系统,包括:

获取模块,其被配置为:获取待生成摘要的代码;

向量提取模块,其被配置为:从待生成摘要的代码中分别提取图嵌入向量和节点嵌入向量;

摘要生成模块,其被配置为:将图嵌入向量和节点嵌入向量,输入到预训练的深度学习模型中,输出代码的摘要。

第三方面,本公开还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述第一方面所述的方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010387446.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top