[发明专利]一种检测短串联重复序列扩张的方法有效
申请号: | 201810499329.5 | 申请日: | 2018-05-23 |
公开(公告)号: | CN108660200B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 杨旗;唐北沙;梁帆;江泓;杨帆;沈璐;汪德鹏 | 申请(专利权)人: | 北京希望组生物科技有限公司;中南大学湘雅医院 |
主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 陆惠中;王永伟 |
地址: | 102206 北京市昌平区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种检测短串联重复序列扩张的方法,其包括如下步骤:1)序列比对;2)RepeatHMM检测三代测序数据短串联重复;3)inScan检测短串联重复区域的序列插入;4)计算RepeatHMM检测结果与短串联重复区域的序列插入检测结果的交集。本发明结合序列插入检测和RepeatHMM短串联重复检测结果,提高了检测短串联重复序列扩张的特异性。 | ||
搜索关键词: | 一种 检测 串联 重复 序列 扩张 方法 | ||
【主权项】:
1.一种检测短串联重复序列扩张的方法,其包括如下步骤:1)获得三代测序数据;2)序列比对使用序列比对软件将所述三代测序数据比对到参考基因组;3)RepeatHMM检测所述三代测序数据短串联重复使用RepeatHMM检测短串联重复单元数目,判断短串联重复区域是否存在重复单元扩张;4)inScan检测短串联重复区域的序列插入对三代测序数据比对结果,提取目标区域内的reads;计算reads片段内的插入序列si的参考基因组位置和长度,如果si的长度大于或等于阈值γ,那么记录si;检测reads片段间插入序列,设一条reads在比对时切分为n条片段Fr1至Frn,所述片段按照其在reads上的开始位置read_start,从小到大进行排序得到片段组成的数组Fr,数组的长度为n,组合其中两个reads片段,计算所述两个reads片段的相对位置,判断所述两个reads片段之间是否存在插入序列,计算插入序列在参考基因组上的位置和插入序列的长度;5)计算RepeatHMM检测结果与短串联重复区域的序列插入检测结果的交集对于一个短串联重复区域,如果RepeatHMM检测到该短串联重复区域存在重复单元扩张,同时检测到该短串联重复区域存在序列插入,则所述短串联重复区域称为RepeatHMM检测结果与短串联重复区域的序列插入检测结果的交集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京希望组生物科技有限公司;中南大学湘雅医院,未经北京希望组生物科技有限公司;中南大学湘雅医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810499329.5/,转载请声明来源钻瓜专利网。