[发明专利]模拟癌症基因组测序数据生成装置有效
申请号: | 201810256018.6 | 申请日: | 2018-03-27 |
公开(公告)号: | CN110021357B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 荆瑞琳;王娟;李大为;玄兆伶;王海良 | 申请(专利权)人: | 浙江安诺优达生物科技有限公司;安诺优达基因科技(北京)有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 322000 浙江省金华市义*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种模拟癌症基因组测序数据生成装置,其包括人参考基因组序列位置信息获取模块、捕获区域参考基因组序列获取模块、癌症基因组变异数据模拟模块、模拟癌症基因组测序数据生成模块以及模拟癌症基因组测序数据输出模块。根据本发明,提供了一种能够对各种类型的变异进行模拟、使得生成的模拟测序数据能够适用于评估各种检测软件的性能的算法及装置。 | ||
搜索关键词: | 模拟 癌症 基因组 序数 生成 装置 | ||
【主权项】:
1.一种模拟癌症基因组测序数据生成装置,其包括:人参考基因组序列位置信息获取模块,用于获取人参考基因组序列以及捕获区域位置信息;捕获区域参考基因组序列获取模块,用于将捕获区域的位置信息对应到参考基因组上,获取捕获区域位置所对应的参考基因组序列信息,格式为fasta;癌症基因组变异数据模拟模块,其与所述捕获区域参考基因组序列获取模块相连接,用于通过随机产生和固定加入热点的方式,生成模拟的癌症基因组变异数据;模拟癌症基因组测序数据生成模块,其与所述癌症基因组变异数据模拟模块相连接,用于基于所述fasta格式的所述模拟的癌症基因组变异数据,根据经验性碱基质量值,生成固定读长的fastq序列,从而模拟癌症基因组测序数据,同时生成已知变异信息的索引文件;以及模拟癌症基因组测序数据输出模块,其与所述模拟癌症基因组测序数据生成模块相连接,用于输出生成的模拟癌症基因组测序数据;其中,所述癌症基因组变异数据模拟模块包括:SNV变异模拟子模块,用于在参考基因组序列上按照群体变异频率随机产生点突变从而模拟胚系突变、以及在参考基因组序列上加入常见热点变异从而模拟癌症基因组SNV变异数据;所述癌症基因组变异数据模拟模块还包括下述子模块中的一个、两个或三个子模块:INDEL变异模拟子模块,用于在参考基因组序列上按照群体变异频率随机产生小片段的插入或者缺失从而模拟胚系突变、以及在参考基因组序列上加入常见热点INDEL从而模拟癌症基因组INDEL变异数据;CNV变异模拟子模块,用于在参考基因组序列上,根据给定的扩增序列的起始位置、终止位置和扩增倍数复制所述扩增序列,和/或,根据给定的缺失序列的起始位置、终止位置和缺失倍数删除所述缺失序列,从而模拟癌症基因组CNV变异数据;FUSION变异模拟子模块,用于在参考基因组序列上,根据给定的两个染色体的断点位置和序列长度,将两段序列交换,从而模拟染色体FUSION数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江安诺优达生物科技有限公司;安诺优达基因科技(北京)有限公司,未经浙江安诺优达生物科技有限公司;安诺优达基因科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810256018.6/,转载请声明来源钻瓜专利网。