[发明专利]一种高鲁棒性DNA测序用条形码生成和读取方法有效
申请号: | 201910252268.7 | 申请日: | 2019-03-29 |
公开(公告)号: | CN110060734B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 陈为刚;王丽霞;韩明哲 | 申请(专利权)人: | 天津大学 |
主分类号: | G16B25/10 | 分类号: | G16B25/10 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种高鲁棒性DNA测序用条形码生成和读取方法,属于基因组学的高通量测序领域,将已知伪随机序列与相同长度的短码长循环码逐比特组合成比特对,比特对映射为一个碱基,不同的碱基序列经过筛选后就构成了测序用条形码;进一步,提出用循环移位和动态规划判断接收测序用条形码发生插入、删节错误的位置,修正接收的纠错码字并进行译码的处理方法。混样测序中,该发明对测序条形码的各类错误均具有良好纠错能力,能够对抗合成、建库以及测序中的插入(insertion)、删节(deletion)与替代错误,具有很高的鲁棒性。 | ||
搜索关键词: | 一种 高鲁棒性 dna 测序用 条形码 生成 读取 方法 | ||
【主权项】:
1.一种高鲁棒性DNA测序用条形码生成和读取方法,其特征在于,所述方法包括以下步骤:(1)用长度为k的信息序列mi表示不同的DNA测序样本,信息序列mi采用短码长分组循环码生成长度为n的编码码字c;然后产生长度为n的伪随机序列p;将伪随机序列p与编码码字c进行逐比特组合,按照预设规则将比特对映射为碱基得到长度为n的碱基序列b,即得到最多支持2k的不同样本混合测序的DNA测序条形码;(2)不同样本的信息序列生成不同的测序条形码,对各个样本分别进行样本建库;利用引物合成技术合成测序条形码正链和反链,合成时在正链3’端添加一个T碱基;通过退火正链和反链,合成具有3’端T尾粘性末端的双链条形码DNA;利用DNA末端修复酶对已打断的待测样本进行尾端修复同时在3’端添加A尾粘性末端;在DNA连接酶的作用下将条形码添加至待测样本;混合样本上机进行高通量测序,得到包含不同错误的混合样品接收序列;(3)根据解映射后得到的对应已知伪随机序列的部分,通过相关检测或动态规划法获取伪随机序列窗口,进而得到测序用条形码的窗口,接收窗口的测序用条形码解映射后,得到接收随机序列s和接收码字d;(4)将s和d依次左循环移位i次得s(i)和d(i),将p依次左循环移位k次,得到p(k),比较p(k)和s(i),利用动态规划标记插入/删节位置,对d(i)进行修正并纠错纠删译码,产生候选码字集选择译码成功的码字作为最终译码结果据此将测序读段分配至不同样本。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910252268.7/,转载请声明来源钻瓜专利网。