[发明专利]mRNA亚细胞定位模型训练方法、定位方法及可读存储介质在审
申请号: | 202111138369.5 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113837293A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 邹权;李静;杜军平 | 申请(专利权)人: | 电子科技大学长三角研究院(衢州) |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G16B30/00 |
代理公司: | 成都创新引擎知识产权代理有限公司 51249 | 代理人: | 林庆华 |
地址: | 324003 浙江省衢*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | mrna 细胞 定位 模型 训练 方法 可读 存储 介质 | ||
1.一种mRNA亚细胞定位模型的训练方法,其特征在于,包括以下步骤:
S1获取mRNA亚细胞位置序列样本集;
S2根据多种特征提取算法对mRNA亚细胞位置序列样本集进行特征提取,得到多个特征集;
S3根据多个基分类器分别对多个所述特征集进行识别,并对基分类器进行至少一层集成,得到集成分类器;
S4根据所述多种特征提取算法和所述集成分类器,得到目标mRNA亚细胞定位模型。
2.根据权利要求1所述mRNA亚细胞定位模型的训练方法,其特征在于,步骤S1,包括以下步骤:
S11获取mRNA亚细胞位置序列数据作为阳性数据,非mRNA亚细胞位置序列文件作为阴性数据;
S12对阳性数据和阴性数据进行数据处理,得到mRNA亚细胞位置序列样本集。
3.根据权利要求1所述mRNA亚细胞定位模型的训练方法,其特征在于,步骤S2中,多种特征提取算法包括:电子-离子相互作用三核苷酸算法、三核苷酸组成算法、二核苷酸组成算法、k-spaced核酸对组成算法、平行相关伪二核苷酸组成算法、平行相关伪三核苷酸组成算法,序列相关伪二核苷酸组成算法、序列相关伪三核苷酸组成算法和基于二核苷酸的自交叉协方差算法任意三种或三种以上。
4.根据权利要求1所述mRNA亚细胞定位模型的训练方法,其特征在于,步骤S3,包括以下步骤:
S31根据所述特征集的亚细胞位置的数据特点和时间复杂度匹配相应的基分类器进行识别;
S32对基分类器进行至少一层集成,得到目标权重参数;
S33根据基分类器和目标权重参数,得到集成分类器。
5.根据权利要求3所述mRNA亚细胞定位模型的训练方法,其特征在于,所述基分类器包括LightGBM算法。
6.根据权利要求1~4任一项所述mRNA亚细胞定位模型的训练方法,其特征在于,步骤S3为:根据多个基分类器分别对多个所述特征集进行识别,并对基分类器进行两层集成,得到两层的集成分类器。
7.根据权利要求6所述mRNA亚细胞定位模型的训练方法,其特征在于,步骤S3,包括以下步骤:
S31根据多个基分类器分别对多个所述特征集进行识别,得到预测结果;
S32根据基分类器对应的所述特征集,对基分类器进行分组,得到基分类器组;
S33根据网格搜索和评估算法,得到目标权重参数;
S34根据基分类器、基分类器组和目标权重参数,得到两层的集成分类器。
8.根据权利要求7所述mRNA亚细胞定位模型的训练方法,其特征在于,评估算法包括以下步骤:ACC算法、recall算法、Precision算法、F1-score算法;计算公式如下:
当真实标签为正样本时,TP、FN分别表示样品的预测结果为正或负的样本数量;当样本的真标签为负,TN、FP分别表示预测标签为负或预测标签为正。
9.一种mRNA亚细胞定位方法,其特征在于,包括以下步骤:
获取mRNA亚细胞位置序列样本;
利用如权利要求1~8任一项所述的目标mRNA亚细胞定位模型对mRNA亚细胞位置序列样本进行识别,得到定位预测结果。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~9任一项所述的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学长三角研究院(衢州),未经电子科技大学长三角研究院(衢州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111138369.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种植物中sgRNA活性预测方法及装置
- 下一篇:一种安全事件显示方法和装置