[发明专利]生物样品分类方法有效
申请号: | 201780007759.4 | 申请日: | 2017-01-23 |
公开(公告)号: | CN109074431B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 珍-克里斯托夫·瓦雷拉;克里斯泰勒·雷内斯 | 申请(专利权)人: | 蒙彼利埃大学;法国国家发展研究院;法国国家科学研究中心 |
主分类号: | G16B40/00 | 分类号: | G16B40/00 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 潘璐;刘继富 |
地址: | 法国蒙*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生物 样品 分类 方法 | ||
1.一种用于对测量生物样品进行分类的方法,其包括:
-获取(9)所述测量生物样品的至少一条DNA解链曲线,所述至少一条DNA解链曲线被称为至少一条测量曲线,
-通过分析源自所述至少一条测量曲线的描述子,确定(10)所述测量生物样品属于不同可能组中的定义组,
-所述获取和所述确定步骤中的每个涉及使用技术手段(101、102),
其特征在于,所述描述子包括每条测量曲线的二阶导数的一个或多于一个点,所述点中的每个或所述点包括对于特定的温度值的所述解链曲线的二阶导数的值。
2.根据权利要求1所述的方法,其特征在于,所述描述子包括每条测量曲线的二阶导数的至少30个点。
3.根据权利要求1或2所述的方法,其特征在于,所述描述子还包括每条测量曲线的一阶导数的一个或多于一个点或者每条测量曲线的一个或多于一个点。
4.根据权利要求1或2所述的方法,其特征在于,所述描述子还包括每条测量曲线的一个或多于一个百分位数。
5.根据权利要求1或2所述的方法,其特征在于,所述确定(10)包括通过随机森林法进行的确定。
6.根据权利要求5所述的方法,其特征在于,所述方法包括学习(6),所述学习(6)包括:
-从属于不同初始组的不同参考生物样品开始获取(1)被称为参考曲线的不同DNA解链曲线,然后
-从所述参考曲线开始确定(2,3)描述子,然后
-通过所述随机森林法构建(8)森林,包括通过所述随机森林法构建若干树,在每颗树的各节点处学习的变量包括一个或多于一个描述子,每颗树的每个叶仅对应于不同可能组中的单个组。
7.根据权利要求6所述的方法,其特征在于确定(2,3)所述描述子,包括:
-初步确定(2)描述子,然后
-消除(3)某些冗余描述子。
8.根据权利要求7所述的方法,其特征在于,所述消除(3)某些描述子包括:对于成对显示的皮尔森相关系数大于0.95的每套描述子,保留单个描述子。
9.根据权利要求6所述的方法,其特征在于,所述方法包括:
-在获取不同的参考曲线之后,识别对应于相同初始组的若干参考曲线,称其为模糊组,并将图谱分成若干亚组,以及
-将该模糊组(4) 分成为若干可能组。
10.根据权利要求6所述的方法,其特征在于,所述方法包括:
-在获取不同的参考曲线之后,识别对应于若干初始组的若干参考曲线,称其为合并组,并将图谱组合成单个组,以及
-将这些合并组统一(5)成单个可能组。
11.根据权利要求1所述的方法,其特征在于,其还包括计算确定所述测量生物样品属于定义组的步骤的置信指数。
12.根据权利要求11所述的方法,其特征在于,计算所述置信指数包括:
-计算属于定义组的参考曲线之间的平均接近性的分布,
-计算所述至少一个测量曲线与属于定义组的参考曲线的平均接近性,以及
-计算属于所述定义组、并且与属于所述定义组的其他参考曲线的平均接近性小于所述至少一条测量曲线与所述属于定义组的参考曲线的平均接近性的参考曲线的水平。
13.根据权利要求11或12所述的方法,其特征在于,所述方法还包括,根据置信指数的值,在确定所述测量生物样品属于定义组的步骤之后,拒绝将所述测量生物样品分配至任何组。
14.根据权利要求1或2所述的方法,其特征在于,获取所述测量生物样品的至少一条DNA解链曲线包括:获取在靶向若干靶DNA分子的若干引物对同时存在的情况下获得的PCR结果的至少一条解链曲线。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蒙彼利埃大学;法国国家发展研究院;法国国家科学研究中心,未经蒙彼利埃大学;法国国家发展研究院;法国国家科学研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780007759.4/1.html,转载请声明来源钻瓜专利网。