[发明专利]一种基因序列识别方法、系统和计算机可读存储介质有效
申请号: | 201910199795.6 | 申请日: | 2019-03-15 |
公开(公告)号: | CN110070914B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 崔大超 | 申请(专利权)人: | 崔大超 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00 |
代理公司: | 深圳市兰锋盛世知识产权代理有限公司 44504 | 代理人: | 马世中 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基因 序列 识别 方法 系统 计算机 可读 存储 介质 | ||
1.一种基因序列识别方法,其特征在于,包括:
获取训练数据集;
对所述训练数据集的数据进行转码处理,以生成对应的输入矩阵;
将所述输入矩阵置入深度学习框架中进行训练,以得到可成长数据模型;
接收待识别的基因序列数据,并将其置入所述可成长数据模型,以生成基因序列识别结果信息;
还包括:
获取初始训练数据集;
对所述初始训练数据集的数据进行转码处理,以生成对应的输入矩阵;
将所述输入矩阵置入深度学习框架中进行训练,以得到初始数据模型;
接收待识别的基因序列数据,并将其置入所述初始数据模型,以生成基因序列识别结果信息;
在得到初始数据模型之后,还包括:
获取第三方平台的分类数据;
通过预设的合并规则,将所述分类数据与初始训练数据集合并以形成融合训练数据集;
对所述融合训练数据集的数据进行转码处理,以生成对应的输入矩阵;
将所述输入矩阵置入深度学习框架中进行训练,以得到可成长数据模型;
接收待分类未知基因序列数据,并将其置入所述可成长数据模型,以生成基因序列识别结果信息;
采用转码器将基因序列数据转化为深度学习框架的输入矩阵,所述转码器由一对一直接转码与基因序列对应蛋白性质转码两种模式构成解码矩阵;所述深度学习框架是一种包括可变参数的多层卷积层和池化层的混合框架结构。
2.根据权利要求1所述的一种基因序列识别方法,其特征在于,在生成基因序列识别结果信息之后,还包括:
判断所述基因序列识别结果信息的可信度。
3.根据权利要求1所述的一种基因序列识别方法,其特征在于,所述深度学习框架包括卷积层和池化层,所述深度学习框架采用GPU进行加速运算。
4.根据权利要求1所述的一种基因序列识别方法,其特征在于,所述输入矩阵为双层矩阵,第一层矩阵采用一对一编码模式获取,第二层矩阵采用物化性质编码模式获取。
5.一种基因序列识别系统,其特征在于,所述基因序列识别系统包括:存储器及处理器,所述存储器中包括一种基因序列识别方法程序,所述基因序列识别方法程序被所述处理器执行时实现如下步骤:
获取训练数据集;
对所述训练数据集的数据进行转码处理,以生成对应的输入矩阵;
将所述输入矩阵置入深度学习框架中进行训练,以得到可成长数据模型;
接收待识别的基因序列数据,并将其置入所述可成长数据模型,以生成基因序列识别结果信息;
所述基因序列识别方法程序被所述处理器执行时还实现如下步骤:
获取初始训练数据集;
对所述初始训练数据集的数据进行转码处理,以生成对应的输入矩阵;
将所述输入矩阵置入深度学习框架中进行训练,以得到初始数据模型;
接收待识别的基因序列数据,并将其置入所述初始数据模型,以生成基因序列识别结果信息;
在得到初始数据模型之后,还包括:
获取第三方平台的分类数据;
通过预设的合并规则,将所述分类数据与初始训练数据集合并以形成融合训练数据集;
对所述融合训练数据集的数据进行转码处理,以生成对应的输入矩阵;
将所述输入矩阵置入深度学习框架中进行训练,以得到可成长数据模型;
接收待分类未知基因序列数据,并将其置入所述可成长数据模型,以生成基因序列识别结果信息;
采用转码器将基因序列数据转化为深度学习框架的输入矩阵,所述转码器由一对一直接转码与基因序列对应蛋白性质转码两种模式构成解码矩阵;所述深度学习框架是一种包括可变参数的多层卷积层和池化层的混合框架结构。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括一种基因序列识别方法程序,所述基因序列识别方法程序被处理器执行时,实现如权利要求1至4中任一项所述的一种基因序列识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于崔大超,未经崔大超许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910199795.6/1.html,转载请声明来源钻瓜专利网。