[发明专利]一种肿瘤ctDNA信息统计方法有效
申请号: | 201610460870.6 | 申请日: | 2016-06-22 |
公开(公告)号: | CN106156543B | 公开(公告)日: | 2018-11-27 |
发明(设计)人: | 李旭超;黄可君;林清华;葛会娟;施佳卉;张福华;阮力;郑立谋 | 申请(专利权)人: | 厦门艾德生物医药科技股份有限公司 |
主分类号: | G06F19/24 | 分类号: | G06F19/24;G06F19/22 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;姜谧 |
地址: | 361027 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种肿瘤ctDNA信息统计方法,包括如下步骤:(1)DNA提取及测序;(2)序列比对;(3)基本统计;(4)测序批次修正;(5)序列特征校正;(6)拷贝数变异检测;(7)片段差异统计。本发明以ctDNA为检测指标,仅需采集受试者少量静脉外周血即可进行检测。收样方便、简洁,且能够将检测范围扩展至晚期不适于进行活检组织标本采集的患者。 | ||
搜索关键词: | 一种 肿瘤 ctdna 信息 统计 方法 | ||
【主权项】:
1.一种肿瘤ctDNA信息统计方法,其特征在于:包括如下步骤:(1)DNA提取及测序:提取不同样本血浆中的游离DNA,分别直接构建样本文库,其中100~500bp的DNA分子两端被加上测序所用接头,来自不同样本的游离DNA被加上不同的标签序列,从而在一次测序得到的数据中可以使多个不同样本的数据区分开,然后对样本文库进行测序;(2)序列比对:将步骤(1)测序后得到的不同样本的游离DNA的序列与标准人类基因组的序列进行比对,得到上述游离DNA的片段长度信息及其定位于人类基因组相应位置的信息;(3)基本统计:将标准人类基因组划分为多个区域,统计每个区域中所含有的上述游离DNA的序列的个数ni,j和平均GC含量GCi,j,其中i和j分别表示区域编号和样本编号;(4)测序批次修正:为了修正样品数据量的差异,将各个区域按所含的游离DNA的序列的平均GC含量分组,取各分组的GC含量的中位数或算术平均数除以全基因组水平的GC含量的中位数或算术平均数得到修正系数cg,下标g代表不同分组的GC含量,将原始的每个区域的ni,j乘以修正系数cg得到每个区域内ni,j的修正值ni,j’;(5)序列特征校正:引入一个正常人群的control集来修正人类基因组上由于序列特征差异导致的误差,在control集中,定义相对序列数百分比Pi,j为ni,j’和每个样本的总测序数Nj之比,即然后计算得到每个区域的平均百分比在所有样本中,每个区域的标准拷贝率ri,j等于ni,j′除以区域内的期望值,即(6)拷贝数变异检测:以每条染色体的长短臂为统计单元,加和计算包括control集的每个样本中各条染色体长短臂上总拷贝率之和Rk,j,其中k表示染色体长短臂的编号,n表示此染色体臂上包含的区域总数,之后,在control集中计算此长短臂Rk,j的平均值meank和方差sdk,进而即可计算每条染色体臂在对照样本中的z值,如果z小于‑3或者大于3,则该染色体臂发生了数目异常,其中z=(Rk,j‑meank)/sdk;(7)片段差异统计:根据步骤(2)计算所得的片段长度信息,分别统计140‑200bp的主峰位置,及其所占所有序列的比例,进而将这两个值在control集中计算得到的数值分别进行z值的计算,从而反映出待测样本在正常人群中的离群程度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门艾德生物医药科技股份有限公司,未经厦门艾德生物医药科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610460870.6/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置