[发明专利]一种基于Cycle-GAN的蛋白质结构预测方法及装置有效
申请号: | 202011579598.6 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112309497B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 华权高;赵海义;舒芹 | 申请(专利权)人: | 武汉金开瑞生物工程有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00;G06N3/04;G06N3/08 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 刘璐 |
地址: | 430000 湖北省武汉市东湖开发区高新大道*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 cycle gan 蛋白质 结构 预测 方法 装置 | ||
1.一种基于Cycle-GAN的蛋白质结构预测方法,其特征在于,包括如下步骤:
获取多个蛋白质的X射线晶体衍射图像、核磁共振图像和冷冻电镜图像,记X射线晶体衍射图像为第一图像、核磁共振图像为第二图像;
将所述冷冻电镜图像进行有监督数据增强,所述有监督数据增强包括单样本增强、多样本增强;
将与冷冻电镜图像属于相同蛋白质的第一图像或第二图像作为正样本,剩下的第一图像或第二图像作为负样本;将正样本对应的冷冻电镜图像作为目标标签;根据正样本、负样本和目标标签构建模型数据集;
将所述模型数据集划分为训练集、验证集和测试集,利用所述模型数据集对Cycle-GAN进行训练直至其损失函数值低于阈值且不再变化,停止训练,得到训练完成的Cycle-GAN;所述Cycle-GAN包括第一Cycle-GAN、第二Cycle-GAN,所述第一Cycle-GAN包括第一生成器、第一判别器、第一重构生成器、第一重构判别器,所述第二Cycle-GAN包括第二生成器、第二判别器、第二重构生成器、第二重构判别器;所述第一生成器,用于根据X射线晶体衍射图像生成对应的冷冻电镜图像;所述第一判别器,用于判断所述第一生成器生成的冷冻电镜图像的真实性;第一重构生成器,用于根据冷冻电镜图像生成对应的X射线晶体衍射图像、第一重构判别器用于判断所述第一重构生成器生成的X射线晶体衍射图像的真实性;所述第二生成器,用于根据核磁共振图像生成对应的冷冻电镜图像;所述第二判别器,用于判断所述第二生成器生成的冷冻电镜图像的真实性;第二重构生成器,用于根据冷冻电镜图像生成对应的核磁共振图像;第二重构判别器用于判断所述第二重构生成器生成的核磁共振图像的真实性;
将待预测蛋白质结构的第一图像或第二图像输入到所述训练完成的Cycle-GAN,得到对应的冷冻电镜图像;将所述对应的冷冻电镜图像进行滤波去噪、融合和三维重构,得到待预测蛋白质的三维图像;所述将所述对应的冷冻电镜图像进行滤波去噪、融合和三维重构,得到待预测蛋白质的三维图像包括如下步骤:将所述冷冻电镜图像进行分类,得到颗粒数据和投影图;对冷冻电镜图像中的颗粒数据进行PCA降维,然后在降维后的低维数据空间中对所述颗粒数据进行聚类,得到了聚类后的类平均图;建立投影图和类平均图之间的关系,基于KNN算法匹配所述类平均图与其对应的投影图,得到颗粒数据的若干个侯选角度;根据所述若干个候选角度进行搜索,直至得到所有颗粒数据的真实投影角度;融合所有真实投影角度对应的颗粒数据和投影图,并得到蛋白质三维图像。
2.根据权利要求1所述的基于Cycle-GAN的蛋白质结构预测方法,其特征在于,所述将所述冷冻电镜图像进行有监督数据增强包括如下步骤:
若蛋白质对应的冷冻电镜图像数量为1,则对所述冷冻电镜图像进行单样本增强;所述单样本增强包括几何变换、颜色变换;
若蛋白质对应的冷冻电镜图像数量大于1,则对所述冷冻电镜图像进行多样本增强。
3.根据权利要求2所述的基于Cycle-GAN的蛋白质结构预测方法,其特征在于,所述几何变换至少包括对图像的翻转、旋转、剪裁、变形、缩放中的一种;所述颜色变换至少包括对图像的内容进行模糊、擦除、填充、噪声叠加、颜色更换中的一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉金开瑞生物工程有限公司,未经武汉金开瑞生物工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011579598.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据的处理方法、装置、电子设备、存储介质
- 下一篇:一种眼科病人视觉测试装置