[发明专利]一种基于融合不同模式标志物的分类模型构建算法有效
申请号: | 202010284362.3 | 申请日: | 2020-04-12 |
公开(公告)号: | CN111584005B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 黄鑫;廖振前;苏本哲 | 申请(专利权)人: | 鞍山师范学院 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16H50/70;G16H70/20;G01N33/50 |
代理公司: | 鞍山嘉讯科技专利事务所(普通合伙) 21224 | 代理人: | 张群 |
地址: | 114007 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 融合 不同 模式 标志 分类 模型 构建 算法 | ||
1.一种基于融合不同模式标志物的分类模型构建算法,其特征在于,包括如下步骤:
步骤一:筛选具有强判别能力的单特征
A根据第一评价准则计算每一个单特征的第一得分△,并基于第一得分△对所有的单特征进行降序排序,第一评价准则计算方式如下:
pi(cl)=prob(fiSi|yt=cl) (1)
△i=|pi(c1)-pi(c2)| (2)
公式(1)中Si表示特征fi在所有样本上的均值,pi(cl)表示在cl类样本中事件fiSi的概率;△i值越大,表明特征fi区分能力越强;
B根据第二评价准则计算每一个单特征的第二得分τ;当一些单特征具有相同的第一得分时,利用第二得分τ对其进行进一步的区分,第二评价准则计算方式如下:
τi=|γi(c1)-γi(c2)| (4)
公式(3)中γi(cl)表示特征fi在cl类样本中表达值的平均含量,公式(4)中τi能够反映特征fi的表达值在两类样本中波动情况;τi值越大,表明特征fi区分能力越强;
步骤二:筛选具有强判别能力的比值特征
A根据第一评价准则计算每一个比值特征的第一得分△,并基于第一得分△对所有的比值特征进行降序排序,第一评价准则计算方式如下:
pij(cl)=prob(rijSij|yt=cl) (5)
△ij=|pij(c1)-pij(c2)| (6)
公式(5)中Sij表示特征rij在所有样本上的均值,pij(cl)表示在cl类样本中事件rijSij的概率;△ij值越大,表明特征rij区分能力越强;
B根据第二评价准则计算每一个比值特征的第二得分τ;当一些比值特征具有相同的第一得分时,利用第二得分τ对其进行进一步的区分,第二评价准则计算方式如下:
τij=|γij(c1)-γij(c2)| (8)
公式(7)中γij(cl)表示比值特征rij在cl类样本中表达值的平均含量,公式(8)中τij能够反映比值特征rij的表达值在两类样本中波动情况;τij值越大,表明特征rij区分能力越强;
步骤三:由于使用相同的评价准则来衡量单特征和比值特征的得分,因此可以直接比较单特征和比值特征的判别能力,筛选k个具有强判别能力的单特征或比值特征构成疾病的潜在性标志物;
步骤四:基于每一个所选的单特征或比值特征,构建一个基分类器,分类原理如下:
(i)基于单特征fi所构建的基分类器
A当pi(c1)pi(c2)时,如果在未知样本xu中fiuSi,则预测xu的类标为c1,否则为c2;
B当pi(c1)≤pi(c2)时,如果在未知样本xu中fiu≥Si,则预测xu的类标为c1,否则为c2;
(ii)基于比值特征rij所构建的基分类器
A当pij(c1)pij(c2)时,如果在未知样本xu中fiu/fjuSij,则预测xu的类标为c1,否则为c2;
B当pij(c1)≤pij(c2)时,如果在未知样本xu中fiu/fju≥Sij,则预测xu的类标为c1,否则为c2;
步骤五:融合k个基分类器的分类结果,采用多数投票的方式预测未知样本xu的类标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鞍山师范学院,未经鞍山师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010284362.3/1.html,转载请声明来源钻瓜专利网。