[发明专利]高密度基因芯片的微珠亮暗分类方法、终端和存储介质有效
申请号: | 202210714565.0 | 申请日: | 2022-06-23 |
公开(公告)号: | CN114792386B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 刘超钧;刘若愚;许心意 | 申请(专利权)人: | 苏州拉索生物芯片科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/762;G06V10/74;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 上海申浩律师事务所 31280 | 代理人: | 孟咪 |
地址: | 215024 江苏省苏州市中国(江苏)自由贸易试验区苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 高密度 基因芯片 微珠亮暗 分类 方法 终端 存储 介质 | ||
本发明提供了一种高密度基因芯片的微珠亮暗分类方法、终端和存储介质。微珠亮暗分类方法基于自动编码器和高维空间聚类,用于自动提取高密度基因芯片中作为核酸探针固定载体的微球的高维特征,并将提取出的高维特征直接进行聚类,从而得到微珠的亮暗分类结果,整个过程具有更好的鲁棒性。此外,本申请的技术方案能够从微珠的完整图像中提取更加丰富的信息,从而保证提取出的微珠特征的准确性。
技术领域
本发明涉及生物芯片技术领域,尤其涉及一种基因芯片的微珠亮暗分类方法。
背景技术
在基因芯片的生产制造环节,需要对基因芯片进行解码。在解码的过程中,需要将基因芯片扫描为图像,然后提取图像特征并识别基因芯片上各个微珠的亮暗分布,然后对照参照表解码各个微珠所携带的探针类型,从而完成基因芯片的解码过程。对于扫描后的基因芯片图像而言,现有的特征提取方法,多基于技术人员指定好的固定规则,如提取以每一个微珠中心点为中心,一定矩形或者圆形范围内灰度值的均值作为该微珠的灰度值,进而进行后续的分析处理。但由于微珠并不总是一个非常均匀的圆形,所以这种人为根据理想情况划定的规则并不总能很好地表达微珠。比如若两颗有着相同亮度的微珠,其中一颗因为一些扰动,如灰尘、微珠破裂等因素导致微珠中部一小部分区域变暗;在这种情况下,若仍然取中心矩形区域的均值作为微珠灰度值的表示,则这两颗微珠可能会截然不同。因此,人工选取特征的固定性会在很多情况下限制特征提取的效果。我们需要更加鲁棒而适应性强的方法。
发明内容
为了克服上述技术缺陷,本发明的第一个方面提供一种高密度基因芯片的微珠亮暗分类方法,包括:
步骤S1:将每个微珠的灰度图作为自动编码器模型的输入图像和结果标签,对自动编码器模型的编码器和解码器进行预训练,直至自动编码器模型学会从微珠中自动提取出微珠的高维特征、并且能够从提取到的微珠的高维特征中重构出与输入相同的图像时,则完成自动编码器模型的预训练;
步骤S2:完成自动编码器模型的预训练后,使用编码器的输出作为后续模型的输入,使用解码器计算重构损失以优化模型;
值得注意的是,在完成自动编码器模型的预训练后,编码器的输出将作为后续模型的输入,解码器仅仅作为模型优化时计算重构损失而保留,除此之外,解码器在后续过程中不再起到其他作用;
步骤S3:在自动编码器的编码层后再加一神经网络中的全连接层作为自表达层,并进一步训练自动编码器和自表达层,直至当编码器输出的高维特征作为自表达层的输入、并且输入自表达层的高维特征通过自表达层的表达系数矩阵被自表达时,则完成了自动编码器和自表达层的训练,并在这一过程中,使自表达层中的表达系数矩阵完成构建;
步骤S4:将待分类的每个微珠的灰度图输入训练后的编码器编码以获得当前高维特征;
步骤S5:将当前高维特征输入训练后的自表达层以获得当前表达系数矩阵;
步骤S6:使用谱聚类算法,将自表达层的当前表达系数矩阵作为谱聚类算法中的相似度矩阵进行聚类,从而分出微珠的亮暗。
所述编码器提取出的编码为一组抽象的高维特征。由于神经网络的黑盒特性以及编码存在于高维空间,其并不具备如“均值”这般人类容易理解的意义。但是由于编码可以被自动编码器的解码层成功重构回原始输入图像,而仅靠“均值”、“方差”等特征无法做到这一点,说明编码蕴含着更为丰富的信息。
进一步地,在步骤S6中,使用谱聚类算法对相似度矩阵进行切割,找出能够互相线性表达的样本聚作一类,从而得到微珠的亮暗分类结果。
进一步地,使用谱聚类算法进行聚类包括步骤:(1)将自表达层中的表达系数矩阵当作相似度矩阵W;(2)通过计算相似度矩阵W构建标准化的拉普拉斯矩阵;(3)计算标准化后的拉普拉斯矩阵的前k个特征值与特征向量,构建特征向量矩阵Q;(4)利用K-means聚类算法对特征矩阵Q中的特征向量进行聚类,对应得到相似度矩阵W中每行对象所属的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州拉索生物芯片科技有限公司,未经苏州拉索生物芯片科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210714565.0/2.html,转载请声明来源钻瓜专利网。