[发明专利]一种全基因组关联分析方法、系统及电子设备在审
申请号: | 201810133320.2 | 申请日: | 2018-02-07 |
公开(公告)号: | CN110211631A | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 郭宁;魏彦杰;张慧玲;郑志春;葛健秋;冯圣中 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B30/00;G16B40/30 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 赵勍毅 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请属于基因数据处理技术领域,特别涉及一种全基因组关联分析方法、系统及电子设备。所述全基因组关联分析方法包括:步骤a:对样本的原始测序数据进行SNP点位确定,得到样本的SNP位点信息;步骤b:建立基于参考基因组SNP信息的坐标轴,并根据基于参考基因组SNP信息的坐标轴对样本的SNP位点信息进行特征提取,得到样本的特征向量;步骤c:将样本的特征向量进行聚类,得到样本的代表特征向量,并将所述代表特征向量进行合并,得到非冗余样本。本申请通过将原始数据进行聚类,对样本进行特征表达,找到重要的特征,降低数据的计算量,根据各个样本之间的相似度,将相似度高的样本合并起来,去掉其余的样本,大大降低了内存的需求,提高了效率。 | ||
搜索关键词: | 样本 特征向量 关联分析 全基因组 电子设备 基因组 相似度 坐标轴 聚类 数据处理技术 测序数据 点位确定 特征表达 特征提取 原始数据 非冗余 计算量 参考 合并 申请 内存 基因 | ||
【主权项】:
1.一种全基因组关联分析方法,其特征在于,包括以下步骤:步骤a:对样本的原始测序数据进行SNP点位确定,得到样本的SNP位点信息;步骤b:建立基于参考基因组SNP信息的坐标轴,并根据基于参考基因组SNP信息的坐标轴对样本的SNP位点信息进行特征提取,得到样本的特征向量;步骤c:将样本的特征向量进行聚类,得到样本的代表特征向量,并将所述代表特征向量进行合并,得到非冗余样本。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810133320.2/,转载请声明来源钻瓜专利网。