[发明专利]一种预测DNA序列对靶蛋白激活情况的方法在审
申请号: | 202210584310.7 | 申请日: | 2022-05-26 |
公开(公告)号: | CN115035953A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 赵丽娜;刘袁今生;尧浩东 | 申请(专利权)人: | 中国科学院高能物理研究所 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00 |
代理公司: | 青岛智地领创专利代理有限公司 37252 | 代理人: | 陈海滨 |
地址: | 100049 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种预测DNA序列对靶蛋白激活情况的方法,涉及生物序列分析及生物信息学技术领域,该方法包括:S1、基于现有的DNA序列数据集,对数据集中的每一条DNA序列进行特征向量的提取;S2、对S1中提取的特征向量进行分析,确保样本分布大致均匀,不存在某一类样本过多或过少的情况;S3、利用DNA序列的特征向量构建逻辑回归‑逐步回归模型;S4、训练S3中构建的逻辑回归‑逐步回归模型并进行评价。本发明使用的特征向量提取方法能够将复杂多样的DNA序列中蕴含的生物信息转换为简练的特征向量,对DNA序列分析中加入了逻辑回归与逐步回归相结合的模型,可以有效的剔除不显著的解释变量,在一般的机器学习模型的基础上提高了模型的准确率和敏感度。 | ||
搜索关键词: | 一种 预测 dna 序列 蛋白 激活 情况 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院高能物理研究所,未经中国科学院高能物理研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210584310.7/,转载请声明来源钻瓜专利网。