[发明专利]一种基于深度学习的克隆代码语义检测方法有效
申请号: | 202011205774.X | 申请日: | 2020-11-02 |
公开(公告)号: | CN112215013B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 成肖云;王建荣;王赞;贾勇哲;马国宁 | 申请(专利权)人: | 天津大学;天津泰凡科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/284;G06N3/04 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习的语义克隆检测方法,对于给定代码块对,首先将代码块预处理成TPE的基本单元的序列,然后对它们进行词嵌入操作,用于上下文特性组合的BiLSTM模块;接着,用自注意力机制来集中提取神经网络学习到的克隆代码相关有用信息;将每一个代码片段都被转化为一个向量表示,计算向量之间的欧几里得距离作为分类的特征,对它们进行二分类:如果两个代码块相似,则其经过神经网络生成的向量应该相近,即预测克隆/非克隆。与现有技术相比,本发明的更节省时间,同时可以捕获丰富的语法和语义信息;TPE还可以避免词汇量不足(OOV)的问题。 | ||
搜索关键词: | 一种 基于 深度 学习 克隆 代码 语义 检测 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学;天津泰凡科技有限公司,未经天津大学;天津泰凡科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011205774.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种农业机械翻土装置
- 下一篇:轴承滚子球基面分区研磨设备