[发明专利]恶性肺结节筛查基因标志物、筛查模型的构建方法和检测装置在审
申请号: | 202211453553.3 | 申请日: | 2022-10-08 |
公开(公告)号: | CN116052768A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 邵阳;吴雪;包华;刘睿;吴舒雨;吴旻;杨珊珊;刘思思;郑丽娟 | 申请(专利权)人: | 南京世和基因生物技术股份有限公司;南京世和医疗器械有限公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00;G16B20/10;G06N20/00;G06F18/241 |
代理公司: | 南京新慧恒诚知识产权代理有限公司 32424 | 代理人: | 邓唯 |
地址: | 210032 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 恶性 结节 基因 标志 模型 构建 方法 检测 装置 | ||
1.基因标志物在制备恶性肺结节筛查试剂中的应用,其特征在于,所述的基因标志物是核小体覆盖模式;
所述的核小体覆盖模式通过如下步骤获得:
穷举法生成长度为16bp的短序列集合A;在人类参考基因序列中穷举出所有的长度为16bp短序列集合B,从集合A中将集合B数据剔除后,定义为无效子;
从癌症数据库中获得不同癌种的样本WGS测序结果,提取出多次出现的碱基替换突变;根据碱基替换的位置,从无效子中找到包含这些碱基替换的无效子短序列集合C;
获取东亚人群中频率大于0.01的碱基替换突变;根据碱基替换的位置,从无效子中找到包含这些碱基替换的无效子短序列集合D;从集合C中将集合D的无效子序列排除,定义为新短序列;
统计出样本中能够读取到任意一个新短序列的样本数量,再针对每一个新短序列,搜索出包含这些新短序列的样本数量,将每一个新短序列的样本数量与所有能读取到任意新短序列的样本总数的比例。
2.根据权利要求1所述的基因标志物在制备恶性肺结节筛查试剂中的应用,其特征在于,所述的癌症数据库是PCAWG数据库。
3.根据权利要求1所述的基因标志物在制备恶性肺结节筛查试剂中的应用,其特征在于,不同癌种是指肠癌、肺癌、乳腺癌、胃癌、前列腺癌和肝癌。
4.根据权利要求1所述的基因标志物在制备恶性肺结节筛查试剂中的应用,其特征在于,东亚人群中的碱基替换突变是通过gnomAD数据库获得。
5.恶性肺结节筛查模型的构建方法,其特征在于,包括如下步骤:
步骤1,对阳性组和对照组的样本进行cfDNA的提取并测序,获得读段数据;
步骤2,将读取到16bp新短序列的样本数与所有能读取到任意新短序列的样本总数的比例,作为特征集合;
步骤3,以特征集同作为初始特征值,作为模型特征向量输入至分类模型中,并以肺结节良恶性作为输出值,对模型进行训练,获得早筛模型;
特征集合的获取步骤如下:
步骤2-1,穷举法生成长度为16bp的短序列集合A;在人类参考基因序列中穷举出所有的长度为16bp短序列集合B,从集合A中将集合B数据剔除后,定义为无效子;
步骤2-2,从癌症数据库中获得不同癌种的样本WGS测序结果,提取出多次出现的碱基替换突变; 根据碱基替换的位置,从无效子中找到包含这些碱基替换的无效子短序列集合C;
步骤2-3,获取东亚人群中频率大于0.01的碱基替换突变;根据碱基替换的位置,从无效子中找到包含这些碱基替换的无效子短序列集合D;从集合C中将集合D的无效子序列排除,定义为新短序列;
步骤2-4,统计出样本中能够读取到任意一个新短序列的样本数量,再针对每一个新短序列,搜索出包含这些新短序列的样本数量,将每一个新短序列的样本数量与所有能读取到任意新短序列的样本总数的比例,作为模型的特征集合。
6.根据权利要求5所述的恶性肺结节筛查模型的构建方法,其特征在于,所述的癌症数据库是PCAWG数据库。
7.根据权利要求5所述的恶性肺结节筛查模型的构建方法,其特征在于,不同癌种是指肠癌、肺癌、乳腺癌、胃癌、前列腺癌和肝癌。
8.根据权利要求5所述的恶性肺结节筛查模型的构建方法,其特征在于,东亚人群中的碱基替换突变是通过gnomAD数据库获得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京世和基因生物技术股份有限公司;南京世和医疗器械有限公司,未经南京世和基因生物技术股份有限公司;南京世和医疗器械有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211453553.3/1.html,转载请声明来源钻瓜专利网。