[发明专利]一种增强型生成式对抗网络以及目标样本识别方法有效
申请号: | 201810604607.9 | 申请日: | 2018-06-12 |
公开(公告)号: | CN109063724B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 王书强;申妍燕;张文勇 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 曹卫良 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 增强 生成 对抗 网络 以及 目标 样本 识别 方法 | ||
1.一种增强型生成式对抗网络的构建方法,应用于医学影像领域,其特征在于,所述增强型生成式对抗网络包括至少一个增强型生成器和至少一个增强型判别器,所述增强型生成器将获得的初始数据进行处理得到生成数据,并提供生成数据给增强型判别器,所述增强型判别器对生成数据进行处理,并反馈分类结果给增强型生成器,所述增强型判别器包括卷积层、基础胶囊层、卷积胶囊层和分类胶囊层,所述卷积层、基础胶囊层、卷积胶囊层和分类胶囊层依次相连;通过向量化表达样本的方向信息特征、层次信息特征,提升所述增强型判别器的样本特征表达和特征识别能力,增强生成器学习真实数据整体分布的能力,所述数据为图片;
多个所述增强型生成器按类别生成新的样本数据,多个所述增强型判别器组成增强型判别器阵列,对未标注样本进行类别预测;
在增强型生成式对抗网络的基础上,根据目标样本的类别特点,设计多通道增强型生成式对抗网络;通过不同类别的样本分别训练各个通道的生成式对抗网络;所述目标样本的样本类别数目为N,针对N类数据集数据集整体分布服从分布其中每一类数据子集可表示为并服从分布
具体包括:
对于原始带标注的数据先进行按类别分类,分别对每一类的数据进行常见的数据增强操作;对增强型判别器网络进行训练:
对于包含N类的样本,在模型训练过程中会逐一训练包含N个对抗生成网络;对于第i通道对抗生成网络只输入对应的i类的数据;针对第i通道对抗生成网络,对应的最优化的判别器训练目标函数为:
其中,Loss(G)代表着生成器G的损失函数,它要测量的是真实数据Pdata(x)与生成数据PG(x)之间的差异,初始化判别器网络D的参数θD和设定判别器训练迭代次数nD;训练判别器D时,在每一次的迭代中,从真实数据中采样出若干数据{x1,x2,x3,…xm};从噪声数据中采样出若干数据{z1,z2,z3,…zm},数据为正态分布或者均匀分布;然后通过生成器获得生成若干生成数据计算出若干惩罚项数据∈是一个0~1之间的随机数;然后进行参数更新:
经过以上nD次迭代训练就可以使得增强型判别器得到更好的性能;按照同样的方法,对剩下的N-1个增强型判别器进行训练,从而形成一组N个增强型判别器组;
对增强型生成器进行网络训练:对于一组多通道对抗生成网络,也包含了N个增强型生成器;把训练数据按类别分成N类,并使用每一类的数据对相应的增强型生成器进行训练;
最优化的生成器训练目标函数为:
其中,对于寻找最优化生成器的过程,需要先初始化生成器网络G的参数θG和设定生成器训练迭代次数nG;再从噪声数据中采样出若干数据{z1,z2,z3,…zm},以正态分布或者均匀分布;然后进行参数更新:
然后再返回第一步进行新一轮的迭代,一共进行nG次的迭代更新,就可以使增强型型生成器达到最优的性能;
按照同样的方法,对CSM其他类别的生成器进行训练,从而可以得到一组增强型生成器;
输入噪声数据,通过增强型生成器生成新的标注数据:在得到一组训练好的多通道生成式对抗网络之后,取出所有的增强型生成器对于每一个增强型网络,分别输入一组包括高斯分布和均匀分布的噪声数据,将会生成一组新的带标注数据,它的标注类别为该生成器所对应的类别:
其中,代表新生成第i类数据,Zi代表第i类初始化噪声;以此类推,对一个生成器进行相同的操作,都可以生成新的标注数据;这样便可以增加每类数据的数量,也扩充了数据集的大小;
通过增强型判别器对无标注数据进行类别预测:在得到一组训练好的多通道生成式对抗网络之后,取出所有的生成器从原始未标注疾病数据集中任意取出一份数据分别输入到每一类的判别器当中;每一个判别器都会对此数据类别进行判断(y1,y2,…yN),输出一个0-1之间的数字,数字越接近1意味着被判定为该类的置信度越高;
理想状态下,所有的判别器中只会有一个输出值接近于1,其他的输出值都接近于0;这样就可以判定该输入数据的类别为输出值最大的那一类;如果存在多个接近1的输出值,说明生成器的训练并没有达到最优化的状态,需要继续返回训练;
以此类推,对原始数据集中的每一份未标注数据进行上述操作,会使未标注数据变成标注数据;
基于多通道生成式对抗网络中的判别器对目标样本进行分类:训练好的多通道生成式对抗网络中包含了N个增强型生成式对抗网络;把其中所有的增强型判别器取出来可以形成一组增强型判别器阵列Ds,s=1…N;
N个增强型判别器分别对应着疾病数据的N个类别;
在测试阶段中,取任意测试样本dk分别输入到每一个增强型判别器中,每一个增强型判别器Ds对于输入样本dk会对硬输出一个0~1之间的数字;该数字越大代表该判别器判定测试样本为所对应类别的置信度越高;正常情况下,一组N个增强型判别器对于一个测试样本得输出值中只有一个会接近1,其余的输出值都会接近0;根据以上分析,对于该测试样本dk的类别会被预测为某疾病的第j类样本,按照以上方法,对于测试集中的每一个测试样本重复以上的操作即可对每个样本进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810604607.9/1.html,转载请声明来源钻瓜专利网。