[发明专利]一种面向堆操作程序的内存泄漏检测方法有效

申请号：	201210041025.7	申请日：	2012-02-22
公开（公告）号：	CN102662825A	公开（公告）日：	2012-09-12
发明（设计）人：	王戟;董龙明;陈立前;董威;刘万伟;李仁见	申请（专利权）人：	中国人民解放军国防科学技术大学
主分类号：	G06F11/36	分类号：	G06F11/36
代理公司：	国防科技大学专利服务中心 43202	代理人：	郭敏
地址：	410073 湖***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种面向操作程序内存泄漏检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种面向堆操作程序的内存泄漏检测方法，其特征在于包括以下步骤：

第1步，利用编译器平台对被检测程序进行词法分析、语法分析，生成被检测程序的抽象语法树、控制流图、过程调用图；

第2步，预处理：

2.1切片，即将那些没有使用任何指针类型变量的赋值语句从程序中删除，得到切片后的程序；

2.2将经过切片后的程序中不符合标准形式的指针赋值语句按照转换规则转换成标准形式；

第3步，根据函数中每个指针变量的别名信息定义指针的扩展类型，得到程序的堆内存抽象状态；堆操作程序中，指针变量p的扩展类型定义为：<f₁：<dist；2^PVar>；f₂：<dist，2^PVar>；...f_i：<dist；2^PVar>...；f_n：<dist；2^PVar>>，其中：f₁，f₂，...f_i，...，f_n分别表示p指向内存单元中指针域的名字，1≤i≤n，即：p指向由n个指针域聚集的内存单元，内存单元又称为内存结点；变量dist表示堆中内存结点距离指针p的值；2^PVar表示所有指向距离p所指向内存结点值为dist的内存结点构成的指针变量集，称为指针别名集；变量dist值的范围为：0、1和2，其中：元素0和1表示堆内存中距离p所指向的内存结点精确值，值2是一个抽象值，表示通过某个指针域f_i两次或两次以上的路由次数，在堆内存中这样得到的内存结点又称摘要结点；指针集2^PVar中有两个特殊的元素：空集表示堆内存中没有任何指针变量指向该内存单元，而该内存单元在堆内存中已经被分配；⊥表示某个指针变量p或指针域f_i的值为null，表示该指针变量值为无效内存地址，p或指针域f_i所指向的内存单元在堆中还没有被分配；堆操作程序HP的活性指针变量是程序片段中一类被使用或修改的指针变量，由谓词LivePVar表示；堆内存局部抽象状态是具有活性指针变量的扩展类型构成的集合，即： p_i表示任意一个具有活性的指针变量，表示p_i的扩展类型；

第4步，从被检测程序的过程调用图中自顶向下选择某个函数f，并将函数f入口处的抽象状态设置为空，根据前向数据流迭代方法进行过程内内存泄漏检测，得到堆操作程序中基本语句关于堆内存抽象状态的迁移关系，前向数据流迭代方法是：

4.1初始化函数f中每个程序点i的堆内存抽象状态置为空，并将队列W置为空，W是一个先进先出FIFO的队列，基本元素为对，s为语句，为堆内存局部抽象状态；

4.2将函数f的入口语句s₀和抽象状态加入到队列W；

4.3判断队列W是否为空，如果为空则转第6步，如果不为空则执行4.4；

4.4从队列W中弹出项根据语句s的类型转换抽象状态得到新的抽象状态具体方法如下：

4.4.1如果语句s为基本指针赋值语句，则按7种指针赋值语句的类型转换状态得到新的抽象状态并从控制流图中语句s的后继语句集Succ(s)中选择某个元素s’，然后执行4.5；按7种指针赋值语句的类型转换的方法是：

(1)指针赋值语句p＝null，转换规则是：在状态中，首先从通过某个指针域f_i路由可达p指向内存结点的指针别名集中删除p，然后将置为null，即：将中所有通过f_i路由距离值为0、1和2的指针别名集置为⊥，得到新的抽象状态如果状态中指针p所指向的内存结点存在且没有被其他指针变量或堆内存中其他内存结点通过某个指针域路由可达，则发生内存泄漏，将该语句s和抽象状态加入到内存泄漏队列heapleakListF中，heapleakListF是保存所有发生内存泄漏的语句和状态的队列，基本元素为：语句和抽象状态对

(2)语句p-＞f_m＝null，转换规则是：在状态中，指针变量x代表能够通过某个指针域f_i路由可达p指向内存结点的指针变量；首先，修改x的扩展类型：如果x与p别名，即：x到p的距离为0，则从中将通过f_i路由距离值为1和2的指针别名集置为空；如果x到p的距离值为1或2，则从中通过f_i路由距离为2的指针别名集中删除中通过f_i路由距离值为1和2的指针别名集；然后，将中通过f_m路由距离值为1和2的指针别名集置为空，得到新的抽象状态如果状态中p指向内存结点中的f_m指向的内存结点存在且没有被其他指针变量或其他内存结点通过f_i路由可达，则发生内存泄漏，将语句s和状态加入到内存泄漏队列heapleakListF中；

(3)指针拷贝语句p＝q，转换规则是：首先，在状态下按照规则(1)执行语句p＝null得到中间抽象状态然后在中间抽象状态下，将赋值给即将p 的指向修改为q指向的结点，得到新的抽象状态如果状态中p指向的内存结点存在且没有被其他指针变量或堆内存中其他内存结点通过某个指针域路由可达，则发生内存泄漏，将语句s和状态加入到内存泄漏队列heapleakListF中；

(4)语句p＝q-＞f_m，转换规则是：首先，在状态下按照规则(1)执行语句p＝null得到中间抽象状态然后在中间抽象状态下，将中通过f_m路由距离值为1的指针别名集赋值给与中通过某个指针域f_i路由距离值为0的指针别名集，将p加入到中通过f_i路由距离值为1的指针别名集中，得到新的抽象状态如果状态中p指向的内存结点存在且没有被其他指针变量或堆内存中其他内存结点通过某个指针域路由可达，则发生内存泄漏，将语句s和状态加入到内存泄漏队列heapleakListF中；

(5)语句p-＞f_m＝q，转换规则是：首先，在状态下按照规则(1)执行语句p-＞f_m＝null得到中间抽象状态然后在中间抽象状态下，集合Q表示中通过某个指针域f_i路由距离为0的指针别名集，指针变量x表示抽象状态中能够通过f_i一次或多次路由到达p指向的内存结点的指针；按照以下规则修改中间抽象状态首先，修改集合Q中指针变量y的扩展类型将中通过f_i路由距离为0的指针别名集加入到中通过f_i路由距离为1的指针别名集中，将中通过f_i路由距离为1和2的指针别名集添加到中通过f_i路由距离为2的指针别名集中；然后，将通过f_i路由距离q值为0、1和2的指针别名集同q一起添加到中通过f_i路由距离为2的指针别名集中，得到新的抽象状态如果状态中p指向的内存结点中f_m指向的内存结点存在且没有被其他指针变量或堆内存中其他内存结点通过某个指针域路由可达，则发生内存泄漏，将语句s和状态加入到内存泄漏队列heapleakListF中；

(6)内存分配语句p＝malloc()，转换规则是：首先，在状态下按照规则(1)执行语句p＝null得到中间抽象状态然后在中间抽象状态下，新申请一个内存结点并且将该内存结点的地址赋值给指针p，即：将中通过某个指针域f_i路由距离为0的指针别名集置为空集通过f_i路由距离为1和2的指针别名集置为⊥，得到新的抽象状态如果状态中p指向的内存结点存在且没有被其他指针变量或堆内存中其他内存结点通过某个指针域f_i路由可达，则发生内存泄漏，将语句s和状态加入到内存泄漏队列heapleakListF中；

(7)内存释放语句free(p)，转换规则是：在状态中，指针变量w表示活指针变量集LivePVar(HP)中除p所有其他指针变量，首先，从中通过某个指针域f_i路由距离值为0、1和2的指针别名集中删除中通过f_i路由距离为0的指针别名集，然后将中通过f_i路由距离值为0、1和2的指针别名集置为⊥，得到新的抽象状态如果状态中p指向内存结点中某个指针域所指向的内存结点存在没有被其他指针变量或堆内存中其他内存结点通过某个指针域路由所可达，则发生内存泄漏，将语句s和状态加入到内存泄漏队列heapleakListF中；

4.4.2如果语句s为switch条件选择语句，则：首先在当前堆内存抽象状态下求解switch语句条件的真值，然后根据条件真值从Succ(s)中选择下一条执行语句s’，并将s’作为语句s的后继语句，状态作为新的抽象状态执行4.5；

4.4.3如果语句s为无条件跳转语句，则：将目标语句s’作为语句s的后继语句，状态作为新的抽象状态执行4.5；

4.4.4如果语句s为函数调用语句，则执行第5步，得到新的抽象状态从Succ(s)中选择某个元素s’，作为s的后继语句；

4.4.5如果语句s是函数返回语句return e，则在抽象状态下，将指针变量e的扩展类型作为函数返回值的扩展类型，全局指针变量的扩展类型不变，其他局部指针变量的扩展类型赋值置空，得到新的抽象状态并作为函数f的出口状态出口语句s’作为返回语句s的后继语句，然后执行4.5；

4.5将新的抽象状态与后继语句s’的初始状态通过合并操作Join得到该程序点新的抽象状态执行4.6步；合并操作是：当且仅当任意两个抽象状态和存在包括关系时才能合并，否则两个抽象状态分别作为合并操作的元素；两个堆内存抽象状态和存在包含关系当且仅当：状态中任意元素在状态中；合并操作由公式表示为：

4.6将合并后的堆抽象状态采用饱和操作达到饱和状态饱和操作具体步骤如下：

4.6.1将标记变量modified初始化为假；

4.6.2反自反操作：遍历抽象状态中每个指针变量x₁，从中通过某个指针域f_i路由距离为0的指针别名集中删除指针x₁，如果某个指针别名集被修改了，将modified置为真；

4.6.3对称操作：遍历抽象状态中每个指针变量x₂，从中通过某个指针域f_i路由距离为0的指针别名集中任意取出某个指针变量y₂，如果中所有通过f_i路由距离为0的指针别名集不包含x₂，则将x₂加入中到通过f_i路由距离为0的指针别名集，如果某个指针别名集被修改了，将modified置为真；

4.6.4传递操作：遍历抽象状态中每个指针变量x₃，从中通过某个指针域f_i路由距离为某个值d₁的指针别名集中任意取出某个指针变量y，在中通过某个指针域路由距离为某个值d₂得到指针别名集Q₂，如果指针别名集Q₂中某个指针变量z不在中通过f_i路由距离为d₁+d₂的指针别名集中，则将z加入到中通过f_i路由距离为d₁+d₂的指针别名集中，如果某个指针别名集被修改了，将modified置为真；

4.6.5判断modified的值，如果为假，状态达到饱和状态转4.7步；否则转4.6.1步；

4.7如果饱和状态与原始状态不同，则将饱和状态作为新的原始状态并且将饱和状态和后继语句s’加入到W中，转4.3；

第5步，对堆操作程序进行过程间的内存泄漏检测，方法是：

5.1获取过程调用语句e＝f(e₁，e₂，...，e_k)的初始化信息，被调用过程名为：f，形式参数为：p₁，p₂，...，p_k，实际参数为：e₁，e₂，...，e_k，其中：p_h代表形式参数，e_h为p_h相对应的实际参数，1≤h≤k，返回值为：ret_f，局部指针变量集为：LVar_f，全局指针变量集为：GVar_f，执行函数调用语句前的堆内存抽象状态为