[发明专利]一种基于深度神经网络和成对约束的聚类方法有效

申请号：	201810765487.0	申请日：	2018-07-12
公开（公告）号：	CN109086805B	公开（公告）日：	2020-07-28
发明（设计）人：	黄嘉桥;王家兵	申请（专利权）人：	华南理工大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	广州市华学知识产权代理有限公司 44245	代理人：	李斌
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度神经网络成对约束方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度神经网络和成对约束聚类的肿瘤特征提取方法，其特征在于，包括以下步骤：

S1、给定一个包含数据间成对约束的包含肿瘤的大小、位置、形状数据集；

S2、对包含肿瘤的大小、位置、形状的数据集进行预处理，得到数据集样本间的差向量；

S3、构建一个自编码网络和一个深度神经网络；

S4、将上述数据集样本的差向量作为自编码网络的输入，同时使用输入的数据集样本的差向量作为自编码网络的输出，将自编码网络的中间输出作为深度神经网络的输入，成对约束作为正确标记，训练自编码网络和深度神经网络；

S5、将训练过的自编码网络和深度神经网络结合到聚类算法上；使用聚类算法提取肿瘤的特征。

2.根据权利要求1所述的基于深度神经网络和成对约束聚类的肿瘤特征提取方法，其特征在于，步骤S4具体包括：使用数据集样本的差向量作为输入，取自编码器的编码部分的输出EO，使用EO作为全连接神经网络的输入，在全连接神经网络的最后一层加上softmax层，预测结果与成对约束比较；其中softmax层是为了将输出转变成一个概率分布，选取最大概率的输出作为预测结果，而预测结果则是在同一类的概率或者不在同一类的概率。

3.根据权利要求1所述的基于深度神经网络和成对约束聚类的肿瘤特征提取方法，其特征在于，步骤S5具体包括：使用该网络模型的预测结果代替传统聚类算法中的距离计算部分；每轮选取所有数据点和每个聚类中心进行预测，先是获取数据点和聚类每个聚类中心的差向量，然后通过自编码网络进行降维操作，然后获取自编码网络的编码部分的输出通过深度神经网络作出预测，给出的数值反映了神经网络认为该样本与聚类中心应该属于同一个聚类的概率或者不属于同一个聚类的概率。

4.根据权利要求1所述的基于深度神经网络和成对约束聚类的肿瘤特征提取方法，其特征在于，网络结构中含有自编码器AE和全连接神经网络FC，因此训练网络时使用的损失函数计算公式如下：

L(AE,FC,CLU)＝L(AE)+L(FC)+L(CLU)

即包括自编码损失L(AE)，全连接网络预测损失L(FC)和聚类损失L(CLU)；

其中自编码损失的计算公式如下：

L(AE)＝L(X,X')＝||X-X'||²＝||X-WH||²

全连接神经网络损失的计算公式如下：

聚类损失的计算公式如下：

对于自编码损失，采用输入自身和经过网络重构得出的结果做最小二乘运算；其中WH代表X通过自编码网络重构出的结果，W是自编码网络中解码网络的权值矩阵，H是自编码网络的解码网络的输入；对于全连接神经网络损失，采用了交叉熵的计算方法；对于聚类损失，采用了k-means聚类方法的损失函数，h_i表示全连接网络第i个输入，M代表聚类中心，S_j是一个向量，该向量只有一个值为1，表示该输入属于该聚类；其余为0，表示该输入不属于该聚类。

5.根据权利要求1所述的基于深度神经网络和成对约束聚类的肿瘤特征提取方法，其特征在于，神经网络中自编码器和全连接神经网络的训练交替进行，即一次训练中，先更新一次自编码器，再更新一个全连接神经网络，最后更新聚类中心点；更新直到整体损失收敛或训练次数到达指定次数后停止；在每轮训练的最后，运用随机梯度下降法，更新网络中各个参数的权重；其中，聚类中心点的更新与神经网络中的参数更新相似，记录每一个聚类中含有多少个数据点，如果数据点越多，那么每个点对聚类中心点的影响就越小；在原来的聚类中心点上加上这次聚类中包含的数据点对中心点产生的偏移量作为新的聚类中心点。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810765487.0/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度神经网络和成对约束的聚类方法有效

专利文献下载