[发明专利]一种生命科学计算容器包系统及方法在审
申请号: | 201910896021.9 | 申请日: | 2019-09-22 |
公开(公告)号: | CN110718269A | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 周会群;王玲 | 申请(专利权)人: | 南京信易达计算技术有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B25/10;G16B30/00;G16B40/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210000 江苏省南京市栖*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 序列数据 基因数据 计算容器 聚类模块 挖掘 分析模块 生命科学 包系统 基因数据库 采集模块 对象组成 固有结构 聚类分析 数据计算 重要数据 容器包 集合 种群 分组 记录 分析 | ||
1.一种生命科学计算容器包系统,包括基因数据采集模块、基因数据分析模块和数据计算容器包,所述基因数据分析模块包括序列数据挖掘模块和序列数据聚类模块,所述序列数据挖掘模块用于对序列数据进行挖掘,所述序列数据聚类模块用于对序列数据进行聚类分析。
2.根据权利要求1所述的生命科学计算容器包系统,其特征在于:所述序列数据挖掘模块包括序列数据表示模块、序列数据训练模块、序列数据降维模块、向量距离夹角计算模块和序列数据识别模块,所述序列数据表示模块用于对DNA序列进行数字化表示;所述序列数据训练模块用于训练数据,并对训练数据设置区别标记;所述序列数据降维模块用于对DVA序列进行降维计算;所述向量距离夹角计算模块用于对不同向量进行距离和夹角计算;所述序列数据识别模块用于对数据进行识别和分类。
3.根据权利要求1所述的生命科学计算容器包系统,其特征在于:所述序列数据聚类模块包括静态聚类模块、时序聚类模块或HMM聚类模块。
4.根据权利要求3所述的生命科学计算容器包系统,其特征在于:所述静态聚类模块包括基因相似度度量模块和层次聚类计算模块,所述基因相似度度量模块用于度量基因的相似度,所述层次聚类计算模块用于对基因进行层次聚类。
5.根据权利要求3所述的生命科学计算容器包系统,其特征在于:所述时序聚类模块包括原始数据变换模块和选择表达谱模块,所述原始数据变换模块用于对原始数据进行变换,所述选择表达谱模块用于选择表达谱。
6.根据权利要求3所述的生命科学计算容器包系统,其特征在于:所述HMM聚类模块包括隐含状态集模块、输出集模块、初始状态概率矩阵模块、状态转移概率矩阵模块和输出概率矩阵模块,所述隐含状态集模块用于包含隐含的,不能通过直接观测而得到基因数据;所述输出集模块输出可通过直接观测而得到的基因数据;所述初始状态概率矩阵模块用于表示每个隐含状态在初始时刻的概率;所述状态转移概率矩阵模块用于表示从一个状态转移至另一个状态的概率;所述输出概率矩阵模块用于表示在某个状态下输出某个输出值的概率。
7.根据权利要求5所述的生命科学计算容器包系统,其特征在于:所述基因数据采集模块包括科学命名模块、来源物种分类模块、参考文献录入模块和基因组数据录入模块,所述科学命名模块用于录入基因序列的科学命名,所述来源物种分类模块用于记录来源物种分类信息;所述参考文献录入模块用于记录参考文献信息;所述基因组数据录入模块用于记录基因组数据。
8.根据权利要求1所述的生命科学计算容器包系统,其特征在于:所述计算容器包包括数据存储模块、运行驻守模块、集中部署模块、运行模块、数据处理模块和节点状态模块,所述数据存储模块用于对数据进行存储,所述运行驻守模块用于负责Arda框架中运行的Vertical驻守,所述集中部署模块用于负责Arda框架创建的Vertical在集群中的部署,所述运行模块用于负责Arda框架运行中Vertical的启动和关闭等服务,所述数据处理模块用于采集、复制、迁移以及输出数据,所述节点状态模块用于负责Arda框架中运行的Vertical的状态以及各节点的状态。
9.一种生命科学计算容器包方法,包括权利要求1-8中任意一项所述的生命科学计算容器包系统,其操作步骤如下:
S1、数据采集:通过学命名模块录入基因序列的科学命名,通过来源物种分类模块记录来源物种分类信息,通过参考文献录入模块记录参考文献信息,通过基因组数据录入模块记录基因组数据;
S2、序列数据挖掘:通过序列数据表示模块对DNA序列进行数字化表示,通过序列数据训练模块训练数据,并对训练数据设置区别标记,通过序列数据降维模块对DVA序列进行降维计算,通过向量距离夹角计算模块对不同向量进行距离和夹角计算,通过序列数据识别模块对数据进行识别和分类;
S3、序列数据聚类:采用基因相似度度量模块度量基因的相似度,采用层次聚类计算模块对基因进行层次聚类;
S4、运行计算容器包:通过数据存储模块对数据进行存储,通过运行驻守模块负责Arda框架中运行的Vertical驻守,通过集中部署模块负责Arda框架创建的Vertical在集群中的部署,通过运行模块负责Arda框架运行中Vertical的启动和关闭等服务,通过数据处理模块采集、复制、迁移以及输出数据,通过节点状态模块负责Arda框架中运行的Vertical的状态以及各节点的状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信易达计算技术有限公司,未经南京信易达计算技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910896021.9/1.html,转载请声明来源钻瓜专利网。