[发明专利]染色体水平基因组的组装方法和组装装置有效
申请号: | 202111649960.7 | 申请日: | 2021-12-29 |
公开(公告)号: | CN114464260B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 赵勇;周勋;康玲;陶琳娜;王静 | 申请(专利权)人: | 上海诺禾致源医学检验实验室有限公司 |
主分类号: | G16B30/20 | 分类号: | G16B30/20;G16B30/10 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 路秀丽 |
地址: | 201100 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 染色体 水平 基因组 组装 方法 装置 | ||
1.一种染色体水平基因组的组装方法,其特征在于,所述组装方法包括:
获取同一物种已知的染色体水平基因组作为参考基因组;
将待组装个体的重叠群或支架通过与所述参考基因组比对,得到对应的坐标信息;
根据所述坐标信息将所述待组装个体的所述重叠群或所述支架挂载到染色体水平,得到所述待组装个体的染色体水平的基因组;
其中,将所述待组装个体的重叠群或支架通过与所述参考基因组比对,得到对应的所述坐标信息包括:
将所述待组装个体的所述重叠群或所述支架比对到所述参考基因组,得到比对文件;
过滤所述比对文件中短于长度阈值的比对序列,得到过滤后的所述比对文件;
将过滤后的所述比对文件转化为比对后的坐标矩阵文件;
根据所述重叠群或所述支架比对在所述参考基因组上的结束位置是否大于起始位置,对所述坐标矩阵文件中的各序列在基因组上的方向信息进行修正,得到修正后的坐标文件;
对所述修正后的坐标文件进行去重处理,得到唯一的对应关系坐标文件,即对应的所述坐标信息;
其中,根据所述坐标信息将所述待组装个体的所述重叠群或所述支架挂载到染色体水平,得到所述待组装个体的染色体水平的基因组包括:
根据查询序列比对开始位置减去结束位置的长度,挑选最长的比对对应关系序列信息,得到最长的比对对应关系文件,其中,所述最长的比对对应关系文件包括5列:1)参考序列的名称;2)查询序列的名称;3)参考序列在比对区域的开始位置;4)参考序列在比对区域的结束位置;5)正号或者负号;
对所述最长的比对对应关系文件中的所述参考序列的名称和所述参考序列在比对区域的开始位置两列进行排序,得到排序后的所述最长的比对对应关系文件;
根据排序后的所述最长的比对对应关系文件,将所述查询序列中没有对应关系的序列名称提取出来,得到未挂载序列的名称文件;
根据排序后的所述最长的比对对应关系文件,将所述查询序列按照所述参考序列在比对区域的开始位置依次输出,同时根据所述未挂载序列的名称文件,将所述未挂载序列不做改变直接输出,得到最终的挂载后的染色体水平的基因组的文件;
其中,对于所述最长的比对对应关系文件中第五列为负号的所述查询序列,将所述查询序列进行反向互补,正号不做处理;
对于同一所述参考序列下,依次输出的不同查询序列之间填充N,生成所述待组装个体与所述参考基因组的对应关系agp文件。
2.根据权利要求1所述的组装方法,其特征在于,根据所述重叠群或所述支架比对在所述参考基因组上的结束位置是否大于起始位置,对所述坐标矩阵文件中的各序列在基因组上的方向信息进行修正,得到修正后的坐标文件包括:
判断所述重叠群或所述支架比对在所述参考基因组上的结束位置是否大于起始位置;
若是,则所述修正后的坐标文件包括以下10列信息:1)参考序列的名称;2)查询序列的名称;3)查询序列的名称和比对开始和结束位置;4)查询序列比对开始位置;5)正号;6)查询序列比对结束位置;7)查询序列比对结束减去开始位置的长度;8)查询序列比对结束减去开始位置的长度与比对长度的比值;9)参考序列在比对区域的开始位置;10)参考序列在比对区域的结束位置;
若否,则所述修正后的坐标文件包括以下10列信息:1)参考序列的名称;2)查询序列的名称;3)查询序列的名称和比对结束和开始位置;4)查询序列比对结束位置;5)负号;6)查询序列比对开始位置;7)查询序列比对开始减去结束位置的长度;8)查询序列比对开始减去结束位置的长度与比对长度的比值;9)参考序列在比对区域的开始位置;10)参考序列在比对区域的结束位置;
其中,所述参考序列指所述参考基因组上染色体水平的序列;所述查询序列指所述待组装个体的所述重叠群或所述支架。
3.根据权利要求2所述的组装方法,其特征在于,对所述修正后的坐标文件进行去重处理,得到唯一的对应关系坐标文件包括:
判断所述查询序列在所述参考基因组上是否存在多个比对位置;
对于存在多个比对位置的所述查询序列,则仅保留所述查询序列在所述坐标信息中最长的对应关系,得到所述唯一的对应关系坐标文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海诺禾致源医学检验实验室有限公司,未经上海诺禾致源医学检验实验室有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111649960.7/1.html,转载请声明来源钻瓜专利网。