[发明专利]一种基于深度学习的染色体极性识别方法和系统有效
申请号: | 202110957126.8 | 申请日: | 2021-08-19 |
公开(公告)号: | CN113408505B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 田婵;赵屹;乔杰;肖立;于天琦;罗纯龙;于富海;罗宇凡;王曼卿;赵相然 | 申请(专利权)人: | 北京大学第三医院(北京大学第三临床医学院);中国科学院计算技术研究所 |
主分类号: | G06V20/69 | 分类号: | G06V20/69;G06N3/04;G06N3/08 |
代理公司: | 北京市众天律师事务所 11478 | 代理人: | 李新军 |
地址: | 100191 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 染色体 极性 识别 方法 系统 | ||
1.一种基于深度学习的染色体极性识别方法,其特征在于,所述方法包括以下步骤:
(1)收集数据集:收集从细胞分裂中期图像中通过染色体分割方法分割出来的单条染色体,旋转收集到的染色体呈竖直状态并提取染色体的极性特征,以短臂朝上或短臂朝下进行极性标注,其中,所述的旋转收集到的染色体呈竖直状态所需的角度计算为式(I)所示:
θ=argminθ(dθ) (I)
其中,投影距离是指两个投影点之间的水平距离,当前旋转角度下染色体区域最左端点在水平面上的投影点为染色体区域最右端点在水平面上的投影点为将所述染色体图像根据旋转角度θ进行逆时针旋转至竖直状态;
(2)构建训练集和测试集:将步骤(1)获得的数据集以7:3划分为训练集和测试集,并对数据集进行预处理和数据扩增,所述的预处理包括使用式(II)对训练集和测试集进行图像归一化:
其中,Io代表原始图片且已规范至0.0到1.0范围,m代表训练集数据在各个通道上的均值,δ代表训练集数据在各个通道上的方差,In代表图像归一化后的图像数据;
(3)将经过步骤(2)获得的训练集中的染色体图像输入到以分类网络结构为主干网络的染色体极性识别模型,并对染色体极性识别模型进行学习训练,其中,使用Softmax函数对输出的2维向量归一化,然后使用交叉熵损失函数度量预测结果与真实结果之间的距离,然后通过随机梯度下降算法对网络参数进行学习;其中,所述分类网络结构为ResNet101,所述ResNet101为101层,包含100层卷积层和全连接层,所述ResNet101的最后一层是一个2048×2的全连接层,该全连接层作为极性分类器,与主干网络形成一个端到端的网络,进行联合训练,所述ResNet101基于bottleneck模块构造,每个bottleneck模块由三个卷积层构成,分别是两个“1×1”的卷积层和一个“3×3”的卷积层,其中两个“1×1”的卷积核负责减少和增加通道维度,通过bottleneck模块减少计算量,与三个卷积层并行的还有一个旁路连接共同组成残差结构,若前后两个bottleneck模块通道维度一致,则采用恒等映射将输入逐元素与三个卷积层输出相加,若前后两个bottleneck模块通道维度不一致,则额外采用一个“1×1”的卷积层增加输入通道维度再与三个卷积层的输出逐元素相加;
(4)将测试集输入到染色体极性识别模型进行测试,输出待预测染色体的极性结果。
2.根据权利要求1所述的方法,其特征在于,步骤(3)所述交叉熵损失函数为式(IV)所示:
其中,L(z,y)表示样本的预测类别与其真实类别的交叉熵损失,z表示最后一个全连接层输出的2维向量,y代表该样本的真实类别,记“down”类为0,“up”类为1,则y∈{0,1},Ncls代表类别数目,i代表类别索引,Zy代表输出向量在真实类别位置处的值,zi代表第i类位置处的值,e为自然底数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学第三医院(北京大学第三临床医学院);中国科学院计算技术研究所,未经北京大学第三医院(北京大学第三临床医学院);中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110957126.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于图像处理的厨房油烟检测方法
- 下一篇:一种固态硬盘的高精密测试系统