[发明专利]甲基化水平的向量化表征、特定测序区间检测方法和装置有效
申请号: | 202010462199.5 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111627499B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 杨昊;蒋泽宇 | 申请(专利权)人: | 广州市基准医疗有限责任公司 |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G16B20/30 |
代理公司: | 广州广典知识产权代理事务所(普通合伙) 44365 | 代理人: | 万志香 |
地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 甲基化 水平 量化 表征 特定 区间 检测 方法 装置 | ||
1.一种甲基化水平的向量化表征方法,其特征在于,所述方法包括:
S10,获取检测样本的各个甲基化测序区间的甲基化信息;其中,所述检测样本包括多个甲基化测序区间;
S20,根据各个甲基化测序区间的甲基化信息确定预设的阅读区间中各类测序结果的Reads数目;其中,所述Reads数目为相应类别的测序结果在相应甲基化测序区间的甲基化信息中的出现次数;所述阅读区间中各类测序结果的排列顺序预先设定;
S30,将滑动窗口在所述阅读区间按照滑动步长从第一个位点至最后一个位点滑动,根据各类测序结果的Reads数目获取各次窗口读取过程中,滑动窗口的各个序列组合的出现次数;其中,所述滑动窗口在读取各个序列组合的出现次数后,按照所述滑动步长向后滑动;
S40,根据各个甲基化测序区间中各个序列组合的出现次数确定各个甲基化测序区间在各次窗口读取过程中产生的次数向量;
S50,将各个甲基化测序区间在各次窗口读取过中产生的次数向量拼接为各个甲基化测序区间的甲基化向量。
2.根据权利要求1所述的方法,其特征在于,所述将滑动窗口在所述阅读区间按照滑动步长从第一个位点至最后一个位点滑动,根据各类测序结果的Reads数目获取各次窗口读取过程中,滑动窗口的各个序列组合的出现次数包括:
S31,在第m次窗口读取过程中,将滑动窗口的首位设置在所述阅读区间的(s(m-1)+1)位,根据各类测序结果的Reads数目读取所述滑动窗口中各个序列组合的出现次数;其中,m的初始值为1,s表示滑动步长;
S32,若在第m次窗口读取过程中,所述滑动窗口的末位不为所述阅读区间的末位,则将m更新为m+1,返回执行步骤S31,直至所述滑动窗口的末位为所述阅读区间的末位。
3.根据权利要求2所述的方法,其特征在于,若所述滑动窗口的末位超出所述阅读区间,根据各类测序结果的Reads数目读取所述滑动窗口中各个序列组合的出现次数包括:
缩短所述滑动窗口,使所述滑动窗口的末位落在所述阅读区间的末位,根据各类测序结果的Reads数目确定当前滑动窗口中各个序列组合的出现次数。
4.根据权利要求2所述的方法,其特征在于,所述根据各个序列组合的出现次数确定各次窗口读取中产生的次数向量包括:
设置滑动窗口的各个序列组合的排列顺序,得到组合顺序;
在各次窗口读取中,将各个序列组合的出现次数按照所述组合顺序排列,得到所述次数向量。
5.根据权利要求2所述的方法,其特征在于,所述将各次窗口读取中产生的次数向量拼接为甲基化向量包括:
将各次窗口读取中产生的次数向量按照窗口读取顺序首尾相连,得到所述甲基化向量。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述获取检测样本的各个甲基化测序区间的甲基化信息包括:
采用预设面板对所述检测样本的各个甲基化测序区间进行重亚硫酸盐法测序,使所述各个甲基化测序区间中被甲基化的位点采用第一标识表征,未被甲基化的位点采用第二标识表征,得到所述各个甲基化测序区间中各个位点的甲基化信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市基准医疗有限责任公司,未经广州市基准医疗有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010462199.5/1.html,转载请声明来源钻瓜专利网。