[发明专利]一种基于大数据的染色体异常位点的筛选方法在审

专利信息
申请号: 201710492071.1 申请日: 2017-06-26
公开(公告)号: CN107194206A 公开(公告)日: 2017-09-22
发明(设计)人: 沈雨后 申请(专利权)人: 思畅信息科技(上海)有限公司
主分类号: G06F19/22 分类号: G06F19/22;G06F19/28
代理公司: 暂无信息 代理人: 暂无信息
地址: 201800 上海市崇明县长兴镇潘园公*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 染色体 异常 筛选 方法
【说明书】:

技术领域

发明涉及基因工程技术领域,特别是涉及一种基于大数据的染色体异常位点的筛选方法。

背景技术

单核苷酸多态性(single nucleotide polymorphism, SNP)位点,是指在基因组上单个核苷酸的变异形成的遗传标记,其数量很多,多态性丰富。单核苷酸多态性,主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种,占所有已知多态性的90%以上。单核苷酸多态性在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。

对目标区域通过一定的算法或者软件运算可以得到目标区域中潜在的单核苷酸多态性位点,在所得到的这些单核苷酸多态性位点中通常很难对找到的位点进行异常验证,如何从数以千计的单核苷酸多态性位点中精确筛选出异常位点是现在面临的一个难题。

发明内容

为克服现有技术的不足,本发明的目的在于提供一种基于大数据的、能够精准、快速筛选出染色体异常位点的筛选方法。

为实现上述目的,本发明通过以下技术方案实现:

一种基于大数据的染色体异常位点的筛选方法,包括如下步骤:

建立数据库:以预设疾病名称结合多态性、META分析、单核苷酸多态性、遗传性变异、GWAS分析中的至少一个作为关键词,在PubMed数据库中检索文献,根据所检索文献的摘要筛选出符合预设条件的相关联文献,将所述相关联文献下载到计算机的存储器,建立一个数据库;

确定位点的比值比:获取所述数据库中与所述预设疾病相关的所有位点的信息,从所述相关联文献的内容中确定出所述位点的比值比;

核查位点的频率:在HapMap数据库中输入所述位点,确定出在预设人群范围内所述HapMap数据库中所述位点对应基因型的研究频率,剔除没有频率以及最小等位基因频率小于3%的位点;将经剔除后保留的位点作为预设异常位点,将所述预设异常位点的比值比和频率汇总;

预实验验证:按照所述预设异常位点前后的序列,从NCBI中获取所述预设异常位点前后的序列片段,根据所述预设异常位点前后的序列片段设计PCR引物、探针;选取细胞样本并进行DNA抽提,采用RT-PCR技术进行DNA分型并进行数据分析,若数据分析显示出预设分型结果,则将所述预设异常位点确定为异常位点。

进一步的,所述确定位点的比值比具体包括:从所述相关联文献的内容中确定出与位点的比值比的相关数据,对所述相关数据进行处理,确定出所述位点的比值比。

进一步的,所述关键词还包括预设人群范围,以限定检索的范围。

有益效果:利用大数据建立数据库,以一些特殊的关键词来检索,将与预设条件的相关联文献全部下载下来,确定位点的比值比,然后核查位点的频率,再将剔除后保留的位点作为预设异常位点,最后通过预实验验证的方式,最终确认出异常位点。按照预设异常位点前后的序列,从NCBI中获取所述预设异常位点前后的序列片段,根据所述预设异常位点前后的序列片段设计PCR引物、探针;选取细胞样本并进行DNA抽提,采用RT-PCR技术进行DNA分型,进行数据分析,若数据分析显示出预设分型结果,则将所述预设异常位点确定为异常位点,该验证手段保证了精准度。

具体实施方式

下面对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。

一种基于大数据的染色体异常位点的筛选方法,包括如下步骤:

建立数据库:以预设疾病名称结合多态性(polymorphism)、META分析(meta)、单核苷酸多态性(single nucleotide polymorphism,SNP)、遗传性变异(genetic variant)、GWAS分析(Genome-wide association study,GWAS)中的至少一个作为关键词,在PubMed数据库中检索文献,根据所检索文献的摘要筛选出符合预设条件的相关联文献,将相关联文献下载到计算机的存储器,建立一个数据库;

关键词示例:

(1)预设疾病名称+多态性;

(2)预设疾病名称+单核苷酸多态性;疾病名称+GWAS分析;

(3)预设疾病名称+多态性+META分析;

(4)预设疾病名称+单核苷酸多态性+META分析;

(5)预设疾病名称+遗传性变异;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思畅信息科技(上海)有限公司,未经思畅信息科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710492071.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top