[发明专利]一种基于SOM和K-means两阶段聚类的软件负载特征提取方法有效
申请号: | 201510996261.8 | 申请日: | 2015-12-25 |
公开(公告)号: | CN105654120B | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 沙江;陈苗苗;张阳;时龙兴 | 申请(专利权)人: | 东南大学苏州研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F11/34;G06F11/30 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈国强 |
地址: | 215123 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 som means 阶段 软件 负载 特征 提取 方法 | ||
本发明公开了一种基于SOM和K‑means两阶段聚类的软件负载特征提取方法,包括以下步骤:(1)从软件执行过程中的动态指令流中提取负载特征:首先将软件执行过程划分为若干个片段,然后对每个程序片段统计特征参数,每个软件会输出多组特征参数,构成一个由多维特征参数组成的矩阵;(2)从特征参数矩阵中提取典型程序片段:利用SOM聚类算法从众多程序片段中找出软件负载特征不同的特征片段簇,再利用K‑means聚类算法从同类型的特征片段簇中找出最能代表这个簇特征的片段。本方法同时弥补了SOM收敛时间过长和K‑means算法对初始点过于敏感、容易陷入局部最优解的缺陷。
技术领域
本发明属于处理器体系结构领域,特别涉及一种基于SOM和K-means两阶段聚类的软件负载特征提取方法。
背景技术
随着移动互联网时代的到来,我们的生活越来越离不开移动智能终端。丰富的应用要求高性能的移动智能终端SoC(System on Chip)提供支持,以满足用户需求。SoC的整体性能很大程度上取决于微处理的性能,也就是SoC的通用处理性能。随着SoC性能的不断提高,微处理器的设计复杂度也大大提高。为了降低设计成本和设计风险,在芯片前端设计阶段,设计人员需要评估架构设计方案,分析影响系统性能的相关因素,根据分析结果与性能指标,确定系统最初的设计方案是否能满足系统需求和规格说明。唯一稳定、可靠的性能度量是实际应用的执行时间。然而实际应用的数量无穷尽,只能选择有限个数的应用程序作为测试程序。
由于程序数量巨大,且负载特征参数也有数十项之多,依靠人工分析测试程序相似性、提取代表性方案,难以获得有效结果。因此,研究人员通常依赖数据处理方法,研究测试程序负载特性的相似性。常用的数据处理方法包括聚类分析、主成分分析等。有文献比较了几种主流的用于提取测试集子集的数据处理方法,包括基于聚类算法的子集提取方法、基于Plackett and Burman设计的子集提取方法、基于指令占比的子集提取方法、基于性能限制因素的子集提取方法、基于程序语言的子集提取方法以及随机提取方法。实验结果表明,基于聚类算法的子集提取方法可以获得代表性较高的子集。有文献也使用k-means聚类算法进行数据处理。
然而,K-means聚类算法的结果受初值的影响较大,容易陷入局部最优,而且对于聚类样本数量较大的情况尤为明显,同时K-means聚类算法对噪声数据(离群点)敏感,会造成所得聚类中心与实际中心位置偏差过大。因此,传统的数据处理方法难以用来从巨量实际应用中提取最典型的负载特征,也就难以构造出代表性最优的测试集,因此,本发明提出了更加有效的方法,结合SOM(Self Organizing Map)和K-means两种聚类算法来做软件负载特征提取。
发明内容
针对上述现有技术存在的软件负载特征多且不易提取的问题,本发明的目的是提供一种基于SOM和K-means两阶段聚类的软件负载特征提取方法。
为实现上述目的,本发明采用以下技术方案:
一种基于SOM和K-means两阶段聚类的软件负载特征提取方法,包括以下步骤:
(1)从软件执行过程中的动态指令流中提取负载特征:首先将软件执行过程划分为若干个片段,然后对每个程序片段统计特征参数,每个软件会输出多组特征参数,构成一个由多维特征参数组成的矩阵;
(2)从特征参数矩阵中提取典型程序片段:利用SOM聚类算法从众多程序片段中找出软件负载特征不同的特征片段簇,再利用K-means聚类算法从同类型的特征片段簇中找出最能代表这个簇特征的片段。
进一步的,步骤(1)中所述的负载特征包括:指令混合比、关键路径长度、寄存器传输特性、工作集容量、访存时间局部性、访存空间局部性、分支行为特性、串行指令、指令空间局部性。从而,每个程序片段会得到一组特征向量,而整个软件就转换为多组特征向量构成的参数矩阵。
进一步的,步骤(1)中,通过CPU模拟器根据进程切换把软件执行过程切分为若干个程序片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学苏州研究院,未经东南大学苏州研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510996261.8/2.html,转载请声明来源钻瓜专利网。