[发明专利]一种通过转录组检测单细胞染色体拷贝数变异方法有效
申请号: | 202211322202.9 | 申请日: | 2022-10-27 |
公开(公告)号: | CN115394359B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 乔杰;李烨;严智强;王玉倩;闫丽盈;王楠;朱小辉;关硕;阔瀛;孔思明 | 申请(专利权)人: | 北京大学第三医院(北京大学第三临床医学院) |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G16B20/50;G16B20/20;G16B20/10 |
代理公司: | 北京中和立达知识产权代理有限公司 11756 | 代理人: | 张可 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 转录 检测 单细胞 染色体 拷贝 变异 方法 | ||
1.一种通过转录组检测单细胞染色体拷贝数变异的方法,其特征在于,所述方法包括如下步骤:
将基因表达量用RPKM标准化后,在人类正常二倍体样本中,删除在所有表达量平均值 1的基因,然后,余下基因的表达量计算变异系数;变异系数的计算如下:
SD是基因在各个样本中表达的标准差,Mean为基因的平均表达量;
根据变异系数的分布情况,由高到低排列变异系数值,挑选变异系数值位于前25%的基因,视为表达不稳定的基因,并将这些基因筛除,剩下基因即为稳定表达的基因,予以保留,用作下一步的计算;
计算每一个基因在人类正常二倍体样本中的平均表达量,形成一个新的矩阵,该矩阵即为人类正常二倍体基因表达参考系:
得到参考系后,根据转录本计算临床样本的拷贝数变异,所述临床样本是指染色体拷贝数未知的、待检测的样本;
首先,制作临床样本基因相对表达量矩阵:先在临床样本的基因表达量矩阵中,挑选出与人类正常二倍体基因表达参考系重合的基因,这些基因在临床样本中的表达量均除以人类正常二倍体基因表达参考系中相对应基因的数值,从而生成临床样本基因的相对表达量矩阵;其中,相对表达量超过4的,将其限制到4,避免单个基因表达的波动对整体的影响过大;假设一个基因X,在人类正常二倍体基因表达参考系中所对应的数值为,基因X在待检测的临床样本中的表达量矩阵为:
基因
同理,则所有临床样本基因相对表达量矩阵为:
得到临床样本基因相对表达量矩阵后,以染色体为单位,计算每个染色体中包含的基因的相对表达量,形成以染色体为单位的相对表达量矩阵,即,染色体相对表达量矩阵,具体操作如下:
利用从UCSC基因组数据库中下载的比对文件,每个临床样本基因相对表达量矩阵中的基因都被对应到其所在的染色体上,每个染色体计算其所包含的基因的相对 表达量:
,
其中为i号染色体的相对表达量,为这些基因的相对表达量,n为人类正常二倍体基因表达参考系中属于i号染色体的基因数量;每个染色体都做一次上述计算,得到染色体相对表达量矩阵:
其中,矩阵中的每一行即为某个样本每一条染色体的相对表达量,chrom代表染色体,chr1为1号染色体,sample1为1号样本,即为2号样本中1号染色体的相对表达量,以此类推;
用中位数对染色体相对表达量矩阵进行归一化,具体步骤如下:
将每个临床样本的22条染色体的表达量乘以一个以样本为单位的系数,令每个样本染色体相对表达量的中位数都等于2,表示其为正常二倍体;
矫正染色体相对表达量矩阵之后,进一步进行拷贝数变异的判断,具体步骤如下:
每个样品中22条常染色体的染色体相对表达量矩阵为,其染色体相对表达量的中位数的数值记为;其染色体表达系数则为:
按照上述公式得到每个临床样本的的值后,用该数值计算该临床样本的22条染色体的相对表达量分别为:
得到的最终染色体相对表达量矩阵中的数值,即染色体拷贝数变异的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学第三医院(北京大学第三临床医学院),未经北京大学第三医院(北京大学第三临床医学院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211322202.9/1.html,转载请声明来源钻瓜专利网。