[发明专利]预测模型的构建方法、多肽合成难度的预测方法及装置有效
申请号: | 201811616843.9 | 申请日: | 2018-12-27 |
公开(公告)号: | CN111383721B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 盛夏;李英连;王卫国 | 申请(专利权)人: | 江苏金斯瑞生物科技有限公司 |
主分类号: | G16C20/70 | 分类号: | G16C20/70 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王学强 |
地址: | 212132 江苏省镇*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 模型 构建 方法 多肽 合成 难度 装置 | ||
1.一种多肽合成难度预测模型的构建方法,其特征在于,包括:
选取多个多肽,以合成-纯化-中控质检作为一个合成轮次分别进行合成;
获取多个多肽的合成数据,所述合成数据包括:多肽序列、目标纯度、目标产品、特征信息和合成难度;
按预设比例随机将多个多肽的合成数据划分为训练数据和测试数据;
分别将所述训练数据和所述测试数据导入预先选取的多个机器学习模型中,对多个机器学习模型进行训练,得到每个机器学习模型的训练结果评价指标值;
依据每个机器学习模型的训练结果评价指标值,对每个机器学习模型的预测结果进行分析,并将预测结果最好的机器学习模型确定为多肽合成难度预测模型。
2.根据权利要求1所述的方法,其特征在于,获取多个多肽的合成数据中的合成难度,包括:
获取每个多肽的合成轮次;
根据预先设定的合成轮次与合成难度之间映射关系,确定每个多肽的合成难度。
3.根据权利要求1所述的方法,其特征在于,多肽的合成难度包括:普通和困难,在所述分别将所述训练数据和所述测试数据导入预先选取的多个机器学习模型中之前,所述方法还包括:
利用过采样SMOTE方法对所述训练数据中合成难度为困难的样本数据进行过采样处理,增加所述训练数据中合成难度为困难的样本数据的数量。
4.根据权利要求1所述的方法,其特征在于,所述依据每个机器学习模型的训练结果评价指标值,对每个机器学习模型的预测结果进行分析,包括:
依据每个所述训练结果评价指标值的权重,对每个所述机器学习模型的训练结果评价指标值进行加权计算,得到每个机器学习模型的预测结果评分,并将预测结果评分最高的机器学习模型确定为预测结果最好的机器学习模型,其中,所述训练结果评价指标值包括准确度、敏感度和特异度。
5.一种多肽合成难度的预测方法,其特征在于,包括:
获取待预测多肽的多肽序列、目标纯度、目标产量和特征信息;
将所述待预测多肽的多肽序列、目标纯度、目标产量和特征信息输入到预先构建的多肽合成难度预测模型中进行处理,得到所述待预测多肽的合成难度,所述多肽合成难度预测模型是根据权利要求1~4中任意一项所述的一种多肽合成难度预测模型的构建方法构建得到的。
6.一种多肽合成难度预测模型的构建装置,其特征在于,包括:
数据获取单元,用于获取多肽合成难度预测模型的训练数据和测试数据;
所述数据获取单元,包括:
多肽合成子单元,用于选取多个多肽,以合成-纯化-中控质检作为一个合成轮次分别进行合成;
合成数据获取子单元,用于获取多个多肽的合成数据,所述合成数据包括:多肽序列、目标纯度、目标产品、特征信息和合成难度;
数据划分子单元,用于按预设比例随机将多个多肽的合成数据划分为训练数据和测试数据;
模型训练单元,用于分别将所述训练数据和所述测试数据导入预先选取的多个机器学习模型中,对多个机器学习模型进行训练,得到每个机器学习模型的训练结果评价指标值;
结果分析单元,用于依据每个机器学习模型的训练结果评价指标值,对每个机器学习模型的预测结果进行分析,并将预测结果最好的机器学习模型确定为多肽合成难度预测模型。
7.根据权利要求6所述的装置,其特征在于,所述合成数据获取子单元包括:
合成难度数据确定子单元,用于获取每个多肽的合成轮次;根据预先设定的合成轮次与合成难度之间映射关系,确定每个多肽的合成难度。
8.一种多肽合成难度的预测装置,其特征在于,包括:
待预测多肽获取单元,用于获取待预测多肽的多肽序列、目标纯度、目标产量和特征信息;
数据处理单元,用于将所述待预测多肽的多肽序列、目标纯度、目标产量和特征信息输入到预先构建的多肽合成难度预测模型中进行处理,得到所述待预测多肽的合成难度,所述多肽合成难度预测模型是根据权利要求1~4中任意一项所述的一种多肽合成难度预测模型的构建方法构建得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏金斯瑞生物科技有限公司,未经江苏金斯瑞生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811616843.9/1.html,转载请声明来源钻瓜专利网。