[发明专利]用于冷冻电镜生物大分子颗粒识别的持续学习方法及系统在审
申请号: | 202110693225.X | 申请日: | 2021-06-22 |
公开(公告)号: | CN113643230A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 李雪明;沈渊;陈健生;张馨予;赵天放 | 申请(专利权)人: | 清华大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李文清 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 冷冻 生物 大分子 颗粒 识别 持续 学习方法 系统 | ||
1.一种用于冷冻电镜生物大分子颗粒识别的持续学习方法,其特征在于,包括:
获取待识别的冷冻电镜图像数据;
将所述待识别的冷冻电镜图像数据输入到训练好的网络参数模型中,获取生物大分子颗粒的识别结果;其中,所述训练好的网络参数模型是由历史训练过程中获取的范例冷冻电镜样本图像数据和冷冻电镜样本图像数据,对神经网络进行训练得到的,所述范例冷冻电镜样本图像数据和所述冷冻电镜样本图像数据标记有生物大分子颗粒坐标标签。
2.根据权利要求1所述的用于冷冻电镜生物大分子颗粒识别的持续学习方法,其特征在于,所述神经网络包括第一分支神经网络和第二分支神经网络,所述第一分支神经网络用于保留上一轮次训练数据的特征,所述第二分支神经网络用于根据所述第一分支神经网络获取当前轮次的模型参数。
3.根据权利要求2所述的用于冷冻电镜生物大分子颗粒识别的持续学习方法,其特征在于,所述训练好的网络参数模型通过以下步骤训练得到:
S1,根据标记有生物大分子颗粒坐标标签的样本冷冻电镜图像数据,构建第一训练样本集;
S2,将所述第一训练样本集分别输入到所述第一分支神经网络和所述第二分支神经网络进行训练,获取预训练的第一分支神经网络和预训练的第二分支神经网络;
S3,根据所述第一训练样本集,提取得到范例冷冻电镜图像数据,并根据所述范例冷冻电镜图像数据和下一训练轮次所需的样本冷冻电镜图像数据,构建第二训练样本集;
S4,基于所述预训练的第一分支神经网络,对所述预训练的第二分支神经网络进行知识蒸馏,并将所述第二训练样本集输入到知识蒸馏后的第二分支神经网络进行训练;
S5,对所述第二训练样本集进行范例提取,重复步骤S3至S4,直至满足预设条件,获取训练好的网络参数模型。
4.根据权利要求1所述的用于冷冻电镜生物大分子颗粒识别的持续学习方法,其特征在于,所述神经网络的损失函数为:
LTotal=LOD+λd*LDistill+λr*LReg;
其中,LTotal表示神经网络的损失函数,所述损失函数包括知识蒸馏损失函数、目标检测损失函数和正则损失函数,LOD表示目标检测损失函数,LDistill表示知识蒸馏损失函数,LReg表示正则损失函数,λd表示用于平衡知识蒸馏损失函数重要性的参数,λr表示用于平衡正则损失函数重要性的参数。
5.根据权利要求1所述的用于冷冻电镜生物大分子颗粒识别的持续学习方法,其特征在于,在所述将所述待识别的冷冻电镜图像数据输入到训练好的网络参数模型中,获取生物大分子颗粒的识别结果之后,所述方法还包括:
对所述生物大分子颗粒的识别结果进行处理,生成特征图,所述特征图用于预测所述生物大分子颗粒位置和大小。
6.根据权利要求1所述的用于冷冻电镜生物大分子颗粒识别的持续学习方法,其特征在于,所述神经网络包括DLA34。
7.一种用于冷冻电镜生物大分子颗粒识别的持续学习系统,其特征在于,包括:
图像数据获取模块,用于获取待识别的冷冻电镜图像数据;
颗粒识别模块,用于将所述待识别的冷冻电镜图像数据输入到训练好的网络参数模型中,获取生物大分子颗粒的识别结果;其中,所述训练好的网络参数模型历史训练过程中获取的范例冷冻电镜样本图像数据和冷冻电镜样本图像数据,对神经网络进行训练得到的,所述范例冷冻电镜样本图像数据和所述冷冻电镜样本图像数据标记有生物大分子颗粒坐标标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110693225.X/1.html,转载请声明来源钻瓜专利网。