[发明专利]一种酿酒酵母菌中DNA复制起点的预测方法有效

申请号：	202010636957.0	申请日：	2020-07-03
公开（公告）号：	CN111755074B	公开（公告）日：	2022-05-17
发明（设计）人：	樊永显;王婉茹	申请（专利权）人：	桂林电子科技大学
主分类号：	G16B40/00	分类号：	G16B40/00;G16B30/00;G06K9/62;G06N3/04;G06N3/08
代理公司：	桂林市华杰专利商标事务所有限责任公司 45112	代理人：	杨雪梅
地址：	541004 广***	国省代码：	广西;45
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种酿酒酵母菌 dna 复制起点预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种酿酒酵母菌中DNA复制起点的预测方法，其特征在于，包括如下步骤：

1)获取样本数据集：获取酿酒酵母菌中的正样本序列和负样本序列；

2)特征提取：使用二进制编码法和PSEKNC-I两种方法表示样本序列，即使用一个向量表示每一条NDA序列；

3)特征选择：使用F-score方法和增量特征选择方法对步骤2)中使用PSEKNC-I法得到的特征进行筛选，得到预筛选特征；

4)特征组合：将步骤2)中采用二进制编码法得到特征和步骤3)得到的预筛选特征进行组合，使用二项分布对组合后的特征进一步筛选，获得特征组合后的样本数据集；

5)构建模型：构建CNN预测模型，将步骤4)获得的样本数据集进行五折交叉验证实验，将五折交叉实验选出的数据集随机分为5组，其中1组作为测试集，剩余4组作为训练集，利用训练集对构建的CNN预测模型进行训练，得到训练后的CNN预测模型，将测试集输入训练后的预测模型分类器中，得到的分类结果即为预测的复制起点的初步结果；

6)参数调优：根据步骤5)得到的初步结果，调整训练后的CNN预测模型中的卷积层数、卷积个数、滤波器大小、步长，以及输出层概率，对训练后的CNN预测模型进行优化；

7)模型评估：使用五折交叉验证法对优化后的CNN预测模型进行评估，并使用敏感性、特异性、准确率、马修斯相关系数四个评估系数对优化后的CNN预测模型的进行衡量，最终得到最优的CNN预测模型，将DNA序列输入最优的CNN预测模型中，即得到最终的DNA复制起点预测结果；

步骤2)中，所述的二进制编码法，是利用0、1表示DNA序列中的核苷酸，把每个DNA序列转化为特征向量，DNA序列中的核苷酸表示方式如下：

公式(1)中，A(0,0,0,0)为DNA序列中的腺嘌呤、C(0,1,0,1)为DNA序列中的胞嘧啶、G(0,0,1,0)为DNA序列中的鸟嘌呤、T(0,0,0,1)为DNA序列中的胸腺嘧啶。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学，未经桂林电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010636957.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种海水养殖尾水微生物净化制剂、其制备方法及其应用
下一篇：一种基于大数据的血液泵数据测试系统及测试方法

同类专利

专利分类

G 物理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种酿酒酵母菌中DNA复制起点的预测方法有效

专利文献下载