[发明专利]一种基于深度神经网络和成对约束的聚类方法有效
申请号: | 201810765487.0 | 申请日: | 2018-07-12 |
公开(公告)号: | CN109086805B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 黄嘉桥;王家兵 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 神经网络 成对 约束 方法 | ||
1.一种基于深度神经网络和成对约束聚类的肿瘤特征提取方法,其特征在于,包括以下步骤:
S1、给定一个包含数据间成对约束的包含肿瘤的大小、位置、形状数据集;
S2、对包含肿瘤的大小、位置、形状的数据集进行预处理,得到数据集样本间的差向量;
S3、构建一个自编码网络和一个深度神经网络;
S4、将上述数据集样本的差向量作为自编码网络的输入,同时使用输入的数据集样本的差向量作为自编码网络的输出,将自编码网络的中间输出作为深度神经网络的输入,成对约束作为正确标记,训练自编码网络和深度神经网络;
S5、将训练过的自编码网络和深度神经网络结合到聚类算法上;使用聚类算法提取肿瘤的特征。
2.根据权利要求1所述的基于深度神经网络和成对约束聚类的肿瘤特征提取方法,其特征在于,步骤S4具体包括:使用数据集样本的差向量作为输入,取自编码器的编码部分的输出EO,使用EO作为全连接神经网络的输入,在全连接神经网络的最后一层加上softmax层,预测结果与成对约束比较;其中softmax层是为了将输出转变成一个概率分布,选取最大概率的输出作为预测结果,而预测结果则是在同一类的概率或者不在同一类的概率。
3.根据权利要求1所述的基于深度神经网络和成对约束聚类的肿瘤特征提取方法,其特征在于,步骤S5具体包括:使用该网络模型的预测结果代替传统聚类算法中的距离计算部分;每轮选取所有数据点和每个聚类中心进行预测,先是获取数据点和聚类每个聚类中心的差向量,然后通过自编码网络进行降维操作,然后获取自编码网络的编码部分的输出通过深度神经网络作出预测,给出的数值反映了神经网络认为该样本与聚类中心应该属于同一个聚类的概率或者不属于同一个聚类的概率。
4.根据权利要求1所述的基于深度神经网络和成对约束聚类的肿瘤特征提取方法,其特征在于,网络结构中含有自编码器AE和全连接神经网络FC,因此训练网络时使用的损失函数计算公式如下:
L(AE,FC,CLU)=L(AE)+L(FC)+L(CLU)
即包括自编码损失L(AE),全连接网络预测损失L(FC)和聚类损失L(CLU);
其中自编码损失的计算公式如下:
L(AE)=L(X,X')=||X-X'||2=||X-WH||2
全连接神经网络损失的计算公式如下:
聚类损失的计算公式如下:
对于自编码损失,采用输入自身和经过网络重构得出的结果做最小二乘运算;其中WH代表X通过自编码网络重构出的结果,W是自编码网络中解码网络的权值矩阵,H是自编码网络的解码网络的输入;对于全连接神经网络损失,采用了交叉熵的计算方法;对于聚类损失,采用了k-means聚类方法的损失函数,hi表示全连接网络第i个输入,M代表聚类中心,Sj是一个向量,该向量只有一个值为1,表示该输入属于该聚类;其余为0,表示该输入不属于该聚类。
5.根据权利要求1所述的基于深度神经网络和成对约束聚类的肿瘤特征提取方法,其特征在于,神经网络中自编码器和全连接神经网络的训练交替进行,即一次训练中,先更新一次自编码器,再更新一个全连接神经网络,最后更新聚类中心点;更新直到整体损失收敛或训练次数到达指定次数后停止;在每轮训练的最后,运用随机梯度下降法,更新网络中各个参数的权重;其中,聚类中心点的更新与神经网络中的参数更新相似,记录每一个聚类中含有多少个数据点,如果数据点越多,那么每个点对聚类中心点的影响就越小;在原来的聚类中心点上加上这次聚类中包含的数据点对中心点产生的偏移量作为新的聚类中心点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810765487.0/1.html,转载请声明来源钻瓜专利网。