[发明专利]一种使用半监督信息进行聚类的回归测试用例选择方法无效

申请号：	201110003162.7	申请日：	2011-01-07
公开（公告）号：	CN102063374A	公开（公告）日：	2011-05-18
发明（设计）人：	陈振宇;陈松宇;冯洋;赵志宏;徐宝文	申请（专利权）人：	南京大学
主分类号：	G06F11/36	分类号：	G06F11/36
代理公司：	南京天翼专利代理有限责任公司 32112	代理人：	黄明哲
地址：	210093 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种使用监督信息进行回归测试选择方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于计算机软件测试技术领域，涉及回归测试中的测试用例选择技术和软件测试中的程序行为聚类分析技术，用于提高回归测试的效率并使测试用例具备较高的错误检测能力，具体为一种使用半监督信息进行聚类的回归测试用例选择方法。

背景技术

随着软件版本的变迁，程序被不断的修改，在修改的过程中可能会在程序的原有功能里引入新的Bug，回归测试技术重复使用之前已开发的测试用例集来测试程序的原有功能，从而确认程序原有功能的正确性没有被修改所影响。但由于原有的测试用例集规模通常很大，执行其中所有的测试用例会耗费巨大的资源和人力，所以人们提出了很多种可行的技术，试图有效的约简测试用例集以提高回归测试的效率。回归测试用例选择技术(Regression test selection technique)就是其中的一种重要技术。

回归测试用例选择技术基于某种标准来选取符合该标准的测试用例子集，以达到约简测试用例集的目的，并通过标准的约束来保证足够高的错误检测能力。该技术包括多种方法，这些方法都有大致相似的过程：

1.确定新旧两个版本的程序，并使用某种形式表示出程序的相关信息，如源代码、控制流图、数据流图……等；

2.基于这些感兴趣的相关信息比较两个版本的程序；

3.识别出两个版本的程序中存在的差别，即修改的地方；

4.选取那些执行路径经过程序修改的测试用例作为候选测试用例集。

回归测试用例选择技术的目的是减少测试用例的数量，但是在约简过程中可能会将实际上能够检测出程序错误的测试用例剔除掉，从而降低了候选测试用例集的错误检测能力。因此，对于回归测试用例选择技术来说，既要能够有效的缩小测试用例集，同时要保证错误检测能力相对于原有的测试用例集不能下降过多，测试用例的数量和错误检测能力这两者的权衡是至关重要的。目前，研究人员提出的各种方法也都对这一问题突出考虑，而有些方法因为没有很好的处理这两者的权衡关系而导致效果不理想。

聚类分析(Cluster analysis)技术是机器学习中数据挖掘技术的一种，是用来分析统计数据的一种实用技术，用于处理分析大量数据来刻画类别、组群特征，并从中获得有意义的信息。给定一个可度量的对象集合，聚类分析过程会将这些对象指派到一系列的类簇中去，使得处于同一类簇中的对象在某种意义上是相似的，而处于不同类簇中的对象是不相似的。这种将对象集合划分成相似的等价类的过程就称作聚类分析。

由于缺少标签信息，传统的聚类分析属于非监督学习。而半监督聚类(Semi-supervised Clustering)是近年来模式识别和机器学习领域的重点问题，利用少部分标签数据辅助大量未标签数据进行训练和聚簇，提高聚类的性能。由于在每次版本修改之后都需要进行回归测试，因此利用多次回归测试结果推演出少量监督信息以提高聚类的性能是一种可行的方法。

现阶段，有研究人员将聚类分析技术用于软件回归测试，对测试用例集划分等价类，从集合中挑选出最有可能具备检错能力的测试用例，提高回归测试的效率并保证足够高的错误检测能力，该研究取得了比较好的成果。但是，在回归测试中使用半监督聚类分析技术目前尚未被正式提出，相关成果也非常少。

发明内容

本发明所要解决的技术问题是：由于没有充分利用测试过程中获得的历史测试结果和测试者本身的测试经验，现有的回归测试用例选择技术在权衡测试用例数量和错误检测能力这两者上表现不佳；提出一种在回归测试用例选择技术中使用半监督聚类分析的方法，通过对程序行为的深入理解，从历史测试结果中推演出或者由测试者本身给出测试用例之间的约束信息用以提高聚类的结果，来有效降低测试用例数量并保持足够高的错误检测能力。

本发明的技术方案为：一种使用半监督信息进行聚类的回归测试用例选择方法，包括一个已通过测试的原始版本程序和基于原始版本的多个修改版本程序，在每个修改版本程序上都要进行回归测试，记录原始版本程序的测试用例集的测试结果为历史信息，每次正式回归测试之前，首先从原始版本程序测试用例集中以5％的比例随机抽取样本，然后根据样本中的测试用例的历史信息提取约束信息作为半监督信息，将原始版本程序的测试用例的函数执行剖面矩阵投影到新的向量空间，以优化聚类结果，具体为：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京大学，未经南京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201110003162.7/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F11-00 错误检测；错误校正；监控
G06F11-07 .响应错误的产生，例如，容错
G06F11-22 .在准备运算或者在空闲时间期间内，通过测试作故障硬件的检测或定位
G06F11-28 .借助于检验标准程序或通过处理作错误检测、错误校正或监控
G06F11-30 .监控
G06F11-36 .通过软件的测试或调试防止错误

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种使用半监督信息进行聚类的回归测试用例选择方法无效

专利文献下载