[发明专利]信使核糖核酸密码子序列的处理方法、装置及电子设备在审
申请号: | 202310202151.4 | 申请日: | 2023-03-03 |
公开(公告)号: | CN116246716A | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 贺选;王德品 | 申请(专利权)人: | 南京燧坤智能科技有限公司 |
主分类号: | G16B50/40 | 分类号: | G16B50/40;G16B40/00;G16B30/10;G16B25/10 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 董文倩 |
地址: | 210033 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信使 核糖核酸 密码子 序列 处理 方法 装置 电子设备 | ||
1.一种信使核糖核酸密码子序列的处理方法,其特征在于,包括:
对多个初始密码子序列进行分类处理,得到第一序列集和第二序列集,其中,所述第一序列集和所述第二序列集是基于所述多个初始密码子序列分别对应的蛋白表达水平和所述多个初始密码子序列分别对应的半衰期确定的,所述多个初始密码子序列对应于不同的信使核糖核酸;
采用所述第一序列集,所述第二序列集,以及所述多个初始密码子序列对应的氨基酸序列,对预先构建的循环生成对抗网络模型进行训练,得到训练后的循环生成对抗网络模型;
基于所述训练后的循环生成对抗网络模型,将所述第二序列集中的初始密码子序列转换为具备第一序列特征的目标密码子序列,其中,所述第一序列特征为与所述第一序列集对应的序列特征。
2.根据权利要求1所述的方法,其特征在于,所述对多个初始密码子序列进行分类处理,得到第一序列集和第二序列集,包括:
获取所述多个初始密码子序列对应的所述蛋白表达水平,以及所述多个初始密码子序列对应的所述半衰期;
基于所述多个初始密码子序列中所述蛋白表达水平大于第一预设数量,并且所述半衰期大于第二预设数量的密码子序列,得到所述第一序列集;
基于所述多个初始密码子序列中所述蛋白表达水平小于第三预设数量,或者所述半衰期小于第四预设数量的密码子序列,得到所述第二序列集,其中,所述第一预设数量大于所述第三预设数量,所述第二预设数量大于所述第四预设数量,所述第一预设数量与所述第三预设数量之间的差值大于预设第一差值,第二预设数量与所述第四预设数量之间的差值大于预设第二差值。
3.根据权利要求1所述的方法,其特征在于,在所述采用所述第一序列集,所述第二序列集,以及所述多个初始密码子序列对应的氨基酸序列,对预先构建的循环生成对抗网络模型进行训练,得到训练后的循环生成对抗网络模型之后,所述方法还包括:
获取第一密码子序列;
基于所述训练后的循环生成对抗网络模型,将所述第一密码子序列转换为具备所述第一序列特征的所述目标密码子序列。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,在所述循环生成对抗网络模型包括第一生成器,与所述第一生成器对应的第一判别器,第二生成器,与所述第二生成器对应的第二判别器,以及翻译器的情况下,所述采用所述第一序列集,所述第二序列集,以及所述多个初始密码子序列对应的氨基酸序列,对预先构建的循环生成对抗网络模型进行训练,得到训练后的循环生成对抗网络模型,包括:
基于所述第一序列集,对所述第一生成器进行训练,得到第三生成器,以及具有第二序列特征的第一生成序列集,其中,所述第二序列特征为与所述第二序列集对应的序列特征;
基于所述第一生成序列集和所述第二序列集,采用所述第一判别器,得到第一判别结果,其中,所述第一判别结果用于指示所述第一生成序列集与所述第二序列集之间的第一区分度;
基于所述第二序列集,对所述第二生成器进行训练,得到第四生成器,以及具有所述第一序列特征的第二生成序列集;
基于所述第二生成序列集和所述第一序列集,采用所述第二判别器,得到第二判别结果,其中,所述第二判别结果用于指示所述第二生成序列集与所述第一序列集之间的第二区分度;
基于所述第一生成序列集和所述第二生成序列集,对所述翻译器进行训练,得到训练后的翻译器,所述第一生成序列集中包括的密码子序列分别对应的第一氨基酸序列,以及所述第二生成序列集中包括的密码子序列分别对应的第二氨基酸序列;
判断所述第一区分度和所述第二区分度是否小于预设区分度;判断所述第一序列集中的初始密码子序列对应的氨基酸序列,与对应的第一氨基酸序列之间的第一相似度是否大于预设相似度;以及判断所述第二序列集中的初始密码子序列对应的氨基酸序列,与对应的第二氨基酸序列之间的第二相似度是否大于预设相似度;
若所述第一区分度小于所述预设区分度,并且所述第二区分度小于所述预设区分度,所述第一相似度大于所述预设相似度,并且所述第二相似度大于所述预设相似度,则停止对所述第一生成器和所述第二生成器的训练,并基于最后一次训练对应的所述第三生成器、所述第四生成器、所述第一判别器、所述第二判别器以及所述训练后的所述翻译器,得到所述训练后的循环生成对抗网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京燧坤智能科技有限公司,未经南京燧坤智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310202151.4/1.html,转载请声明来源钻瓜专利网。