[发明专利]源代码中内存错误的自动检测和定位方法有效
申请号: | 201710079948.4 | 申请日: | 2017-02-15 |
公开(公告)号: | CN106940654B | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 陈哲;严俊琦;杨志斌;黄志球 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F8/41 | 分类号: | G06F8/41 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 唐绍焜 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 源代码 内存 错误 自动检测 定位 方法 | ||
本发明提供了源代码中内存错误的自动检测和定位方法,首先使用编译器对源代码进行词法分析和语法分析,构造符号表和抽象语法树;然后通过遍历抽象语法树,对可能产生内存错误的节点进行源代码变换,最后编译执行变换后的源代码,程序会自动判断内存错误的发生,并准确报告错误对应的源代码位置。本发明可以准确地自动检测和定位内存错误,实现更全面的错误检测,更好的兼容性,更好的平台普适性,更准确的源代码定位,更高的运行时性能和效率,从而提高软件的质量和软件维护的效率。
技术领域
本发明涉及一种源代码中内存错误的自动检测和定位方法,属于计算机软件领域,特别是指计算机软件测试领域。
背景技术
内存错误是一种普遍存在于C/C++程序中的设计缺陷,可能导致软件运行异常和安全漏洞。内存错误包括空间内存错误、时间内存错误、类型内存错误。空间内存错误也称为缓冲区溢出错误,包括:数组越界、指针访问越界、指针使用前未初始化、空指针解引用、对任意整型数据进行强制类型转化得到的指针进行解引用等;时间内存错误包括:悬挂栈指针,悬挂堆指针、多次释放、不完全释放等;类型内存错误包括:释放非堆上的内存空间、将函数指针作为数据指针进行解引用、将数据指针作为函数指针进行函数调用等。这些错误可能导致软件运行异常或崩溃,也可能被黑客利用来执行恶意代码,从而导致安全漏洞。对于安全关键软件和系统,这将会导致严重后果和巨大损失。因此,实现内存错误的高效自动检测和源代码定位,能够帮助开发人员在软件开发过程中发现并改正这些错误,极大地提高软件的质量和软件维护的效率。
目前常见的检测技术主要是扩展指针技术,该技术是通过扩展指针的数据类型,使指针在原来只存储一个内存地址的基础上,再额外记录该指针所指向内存块的基地址和大小等信息,以便在指针解引用时可以判断该指针是否在其所指向内存块的有效区间内,从而判断指针解引用是否存在错误。由于该技术修改了代码中指针的存储结构,造成了处理后的代码与原代码之间的不兼容,导致检测结果不稳定。此外,由于该技术只对指针所指向内存块的边界信息进行了记录,所以只能处理空间内存错误,无法检测时间和类型内存错误。
目前常见的检测技术主要针对二进制代码,即通过对程序的二进制代码进行修改,然后运行修改后的二进制代码以检测内存错误。由于该技术是对二进制代码进行修改,所以不具备平台普适性,即修改工具只能处理主流平台的二进制代码,而无法兼容某些领域所使用的特定的运行平台。此外,由于该技术无法准确定位到错误对应的源代码位置,导致不容易对错误进行调试。
因此,有必要提供一种新的内存错误的自动检测和源代码定位方法,以实现更全面的错误检测,更好的兼容性,更好的平台普适性,更准确的源代码定位,更高的运行时性能和效率,从而克服现有检测技术中存在的问题。
发明内容
为了克服上述已有技术和方法存在的不足,本发明的目的旨在提供一种源代码中内存错误的自动检测和定位方法,该方法通过使用源代码变换技术,将源代码变换为带有自动检测和错误定位功能的源代码,包括对指针定义初始化和赋值节点插入代码来记录或更新指针元数据,对指针解引用和数组下标访问节点插入内存错误检测和源代码定位的机制,对函数定义节点插入代码来更新形参的指针元数据,并插入包装函数定义来在函数之间传递指针元数据,对函数调用节点插入额外的实参来传入原实参的指针元数据;使得可以在软件运行过程中自动检测和定位软件中的内存访问错误,以实现更全面的错误检测,更好的兼容性,更好的平台普适性,更准确的源代码定位,更高的运行时性能和效率,从而克服现有的检测技术中存在的问题。
技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710079948.4/2.html,转载请声明来源钻瓜专利网。