[发明专利]基于图形处理单元的异构特征时序数据演化聚类方法有效
申请号: | 201510266719.4 | 申请日: | 2015-05-23 |
公开(公告)号: | CN104834746B | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 黄晓辉;熊李艳;曾辉;王传云;谢昕;徐剑 | 申请(专利权)人: | 华东交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南昌市平凡知识产权代理事务所36122 | 代理人: | 姚伯川 |
地址: | 330013 江*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于图形处理单元的异构特征时序数据演化聚类方法,包含以下步骤(1)提取原始数据特征,采用多视图方式表示原始数据的异构特征;(2)申请显存空间,并利用图形处理单元提供的数据传输函数把数据传到图形处理单元的显存中;(3)在图形处理单元上进行多矩阵非负分解,迭代的更新特征模矩阵、时序模矩阵和数据对象模矩阵,直到目标函数收敛为止;(4)归一化模矩阵,得到簇中每个特征的隶属概率、簇的时序演化趋势及每个数据对象隶属于每个簇的概率;(5)最后释放显存空间。本发明利用图形处理单元的高并发性来加速多矩阵非负分解过程,在多视图表示中引入时序特征视图,利用多矩阵非负分解后的时序模矩阵,获得簇随时间的演化趋势。 | ||
搜索关键词: | 基于 图形 处理 单元 特征 时序 数据 演化 方法 | ||
【主权项】:
一种基于图形处理单元的异构特征时序数据演化聚类方法,其特征在于,所述方法将异构数据用多视图方法表示,整个数据集利用多个矩阵来表示;根据异构数据的大小申请相应的显存空间,并把数据传入显存;利用图形处理单元进行多矩阵非负分解得到特征模矩阵、时间模矩阵和数据对象分配模矩阵;然后对模矩阵进行归一化处理,得到每个簇的属性分布、每个对象在簇中的隶属度和簇的演化趋势;最后把所有的计算结果从显存回传到主存,包括特征模矩阵、时间模矩阵和数据对象分配模矩阵,并释放所占用的显存空间;所述特征模矩阵的计算如下:更新第q个特征模矩阵Uq的公式为:uijq=uijq(XqTO)ij(UqOTO)ij,]]>式中,为为第q个特征矩阵的第i行,第j列元素的值,最后通过按列归一化,可以转化为第q类特征中第j个属性在第i个簇中出现的概率;在计算Uq时,首先利用图形处理单元提供的矩阵乘法函数计算上式中和UqOTO,分别存在临时空间XqUq和UqOO中;然后利用核函数计算特征模矩阵Uq;在计算过程中,为该核函数开启Iq×k个线程,每个线程执行一个对元素的乘除操作,Iq为第q种特征的属性数目,k为簇的数目;所述时间模矩阵的计算公式为:tij=tij(XτTO)ij+λt(i+1)j(TOTO)ij+λtij,ifi=1,tij(XτTO)ij+λt(i+1)j+λt(i-1)j(TOTO)ij+2λtij,if1<i<IT,tij(XτTO)ij+λt(i-1)j(TOTO)ij+λtij,ifi=IT.]]>式中,λ为时序平滑因子;tij为时间特征模矩阵的第i行、第j列的值,表示第i个簇在第j个时间点的热度趋势;在计算时间模矩阵T时,需要先利用图形处理单元提供的矩阵乘法函数计算然后再设计核函数计算T的值,该核函数只计算时间模矩阵的中间IT‑2列,IT为离散化后的时间戳数目;首列与尾列由中央处理器来计算;因此,需要在图形处理器开启上(IT‑2)×k个线程,每个线程计算一个元素tij的值;所述数据对象分配模矩阵的计算公式为:oij=oij(XτT+Σq=1pXqUq)ij(OTTT+Σq=1pOUqTUq)ij.]]>式中,oij为数据对象分配模矩阵第i行、第j列的值,通过按行归一化后,可以表示第i个数据对象在第j个簇中出现的概率;在计算对象分配模矩阵O时,首先需要利用图形处理单元提供的矩阵乘法操作计算XτT、XqUq、OTTT和然后通过矩阵的加法核函数计算上式中的分子与分母,最后利用矩阵的乘除核函数计算对象分配模矩阵O的值;所述方法具体包括如下步骤:(1)多视图数据表示:提取原始数据的异构特征,每一种类型的特征用一个视图表示,在计算过程中,一个特征视图数据用一个矩阵表示Xi,时序特征用矩阵Xτ表示,这样,数据集可表示为X={Xτ,X1,X2,...,Xp},p为特征矩阵的个数;(2)申请显存空间:在运行聚类算法之前,需要申请显存空间包括:存放原始数据的空间、聚类算法运行的临时空间和结果存放空间,然后把多视图数据X传到显存中;(3)并行多矩阵非负分解:针对显存中存放的多视图数据,在图形处理单元上运行的基于平滑约束的并行多矩阵非负分解方法来获得特征模矩阵Uq,(1≤q≤p)、时序模矩阵T和数据对象模矩阵O,为了获得这三种模矩阵,设计了三个计算公式,分别用来更新特征模矩阵、数据对象模矩阵和时序模矩阵;在计算过程中,每个步骤设计若干个核函数,运行在图形处理单元上;(4)归一化模矩阵:针对并行多矩阵分解后的模矩阵做归一化处理,获得每个簇中特征的分布,每个对象属于不同簇的概率及每个簇的演化趋势;(5)释放显存空间:最后算法运行结束后,释放算法所占用的显存空间。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东交通大学,未经华东交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510266719.4/,转载请声明来源钻瓜专利网。