[发明专利]基于score输出值百分比的可控置信机器分类方法有效
申请号: | 201510012276.6 | 申请日: | 2015-01-08 |
公开(公告)号: | CN104598923B | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 蒋方纯 | 申请(专利权)人: | 深圳信息职业技术学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 张全文 |
地址: | 518000 广东省深圳市龙*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明适用机器学习领域,提供了一种基于score输出值百分比的可控置信机器算法,所述方法包括如下步骤:对二元样本采用二元分类器进行分类;将二元分类器的分类结果转成score输出值;获取未知二元样本的理想错分率,分别以最小输出值和最大输出值为基准,向着原点的方向以等距离步长(设定score的百分比)分别向右或向左一步步的移动,当满足理想错分率,确定阈值范围;如未知二元样本的score输出值属于该阈值范围,将未知样本分配到拒绝域,如未知二元样本的score输出值不属于该阈值范围,将未知样本分配到接受域。本发明提供的技术方案具有精度高,可靠性高的优点。 | ||
搜索关键词: | 二元样本 输出 二元分类 样本分配 可控 置信 机器学习领域 原点 分类结果 机器分类 最大输出 接受域 拒绝域 小输出 算法 分类 移动 | ||
【主权项】:
1.一种基于score输出值百分比的可控置信机器分类方法,其特征在于,所述方法包括如下步骤:获取疾病实验数据的二元样本;对二元样本采用二元分类器进行分类;将二元分类器的分类结果转成输出值Output Score;获取未知二元样本的理想错分率,以最小输出值或最大输出值为基准,向原点向右或向左一步步的移动阈值范围(‑t1,t1),当阈值(‑t1,t1)满足已知二元样本的理想错分率时,确定阈值(‑t1,t1)为未知二元样本的理想错分率对应的阈值范围(‑t1,t1),所述向右或向左一步步的移动阈值范围(‑t1,t1)中每步移动所跨越的Output Score为设定Score百分比值;如未知二元样本的输出值Output Score属于该阈值范围,将未知样本分配到拒绝域,如未知二元样本的输出值Output Score不属于该阈值范围,将未知样本分配到接受域;对拒绝域中的未知样本进行人工处理;从人工处理后的未知样本和接受域中的未知样本中提出特征构成训练集;根据训练集对二元分类器进行训练;二元分类器用于对疾病实验数据进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳信息职业技术学院,未经深圳信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510012276.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种一维条码的生成方法和设备
- 下一篇:指纹成像方法和指纹成像系统