[发明专利]一种基于生物标志物的多变量分类系统和方法在审
申请号: | 202010074837.6 | 申请日: | 2020-01-22 |
公开(公告)号: | CN111276243A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 孟庆华;吴静 | 申请(专利权)人: | 首都医科大学附属北京佑安医院 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/30;G16H50/70;G06K9/62 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 孙楠 |
地址: | 100069 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生物 标志 多变 分类 系统 方法 | ||
1.一种基于生物标志物的多变量分类系统,其特征在于,包括:
获取模块,获取若干被随机分组被测的生物特征的特征值,并将所述生物特征进行归一化处理;
差异检测模块,用于计算每一个所述生物特征在各组样本间差异性的效应量以及多次反复抽样产生的差异性的效应量;
度量计算模块,用于将某一所述生物特征的所有抽样条件下得到的效应量的均值作为生物特征的权重度量,将某一所述生物特征的所有所述效应量的标准差作为生物特征的稳定性度量;
特征划分模块,根据所述权重和稳定性,将所有所述生物特征分为若干特征群;
加权特征生成模块,通过各个所述特征群内的所述生物特征的特征值、权重和稳定性得到各个特征群加权特征,并将各个特征群中大于阈值的加权特征作为生物标志物;
分类模块,根据所述生物标志物,利用分类算法对所述被测进行分类。
2.如权利要求1所述的基于生物标志物的多变量分类系统,其特征在于,所述差异检测模块中用bootstrapping算法随机地从各组中抽取相同数量的样本,计算各组之间的效应量,先通过变换抽样样本容量,来模拟现实中样本属性的多样性,随后在相同抽样样本容量下,进行多次重复抽样计算效应量大小。
3.如权利要求2所述的基于生物标志物的多变量分类系统,其特征在于,所述效应量采用以下公式计算:
其中gi表示各组中第i个生物特征上的差异性的效应量,mean(Pi),mean(Hi)分别表示第一组样本和第二组样本在所述生物特征i上的均值,m表示每一组抽取的样本量,SDp2、SDh2分别表示第一组样本和第二组样本在所述生物特征i上的方差。
4.如权利要求1-3任一项所述的基于生物标志物的多变量分类系统,其特征在于,所述特征划分模块将权重低于阈值的所述生物特征去除,以所有所述生物特征的权重及稳定性作为两个基本特征,利用K-means聚类算法,对所有所述生物特征进行聚类分析,得到具有不同稳定性和权重的若干特征群。
5.如权利要求4所述的基于生物标志物的多变量分类系统,其特征在于,所述加权特征通过将每个所述生物特征与其权重的乘积,并对其所在特征群内所有特征与权重的乘积进行累加得到。
6.如权利要求4所述的基于生物标志物的多变量分类系统,其特征在于,所述分类模块中的分类算法包括支持向量机、随机森林和感知机。
7.如权利要求1-3任一项所述的基于生物标志物的多变量分类系统,其特征在于,所述生物特征包括:消化系统微生物菌群表达量、影像特征、肿瘤标志物,血常规和微量元素含量信息中的至少一种特征。
8.如权利要求1-3任一项所述的基于生物标志物的多变量分类系统,其特征在于,所述分类系统生物标志物能够用于区分患病群体和健康群体。
9.一种基于生物标志物的多变量分类方法,其特征在于,包括以下步骤:
步骤1:将被测随机分为若干组,获取所述被测的生物特征的特征值,并将所述生物特征进行归一化处理;
步骤2:计算每一个所述生物特征在各组样本间差异性的效应量以及多次反复抽样产生的差异性的效应量;将某一所述生物特征的所有抽样条件下得到的效应量的均值作为生物特征的权重度量,将某一所述生物特征的所有所述效应量的标准差作为生物特征的稳定性度量;
步骤3:根据所述权重和稳定性,将所有所述生物特征分为若干特征群;并通过各个所述特征群内的所述生物特征的特征值、权重和稳定性得到各个特征群加权特征,并将各个特征群中大于阈值的加权特征作为生物标志物;
步骤4:根据所述生物标志物,利用分类算法对所述被测进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都医科大学附属北京佑安医院,未经首都医科大学附属北京佑安医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010074837.6/1.html,转载请声明来源钻瓜专利网。