[发明专利]训练多类Boosting分类器的方法无效
申请号: | 200710159768.3 | 申请日: | 2007-12-21 |
公开(公告)号: | CN101464954A | 公开(公告)日: | 2009-06-24 |
发明(设计)人: | 任海兵;金培亭;李宗河 | 申请(专利权)人: | 三星电子株式会社;北京三星通信技术研究有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 北京铭硕知识产权代理有限公司 | 代理人: | 韩明星;李云霞 |
地址: | 韩国京畿道水*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 boosting 分类 方法 | ||
1、一种用于训练多类Boosting分类器的方法,所述方法包括:
(1)提供包括多个类的训练样本的训练数据;
(2)设置性能目标阈值,初始化训练样本的训练权重,其中,训练样本的训练权重包括训练样本的样本权重和类权重,所述训练样本的类权重与所述多个类中与训练样本所属的类相对应;
(3)使用Boosting方法对训练数据中的被训练权重加权的训练样本进行循环训练,其中,在所述循环训练过程中的每次循环之后,得到用于与所述进行训练的训练样本对应的类的弱分类器,将在已经完成的训练循环得到的弱分类器组合为强分类器,并测试所述强分类器的性能以确定是否存在性能达到或超过所述性能目标阈值而完成训练的类,对于完成训练的类,从训练数据中去除完成训练的类的训练样本;对于没有完成训练的类,则根据Boosting方法调整其训练样本的基础权重,并根据其性能调整其类权重,以使在本次以及最近的循环中或仅在本次循环中性能差的类的训练样本在下次循环中的训练权重增大;
(4)将在步骤(3)训练得到的所有弱分类器组合为多类Boosting分类器。
2、如权利要求1所述的方法,其中,根据没有完成训练的类的性能调整其类权重步骤还包括:
增大在本次循环中性能最差的类的类权重;
如果一个类在上一次循环中的性能最差,而在本次循环中的性能不是最差的,则减小所述类的类权重。
3、如权利要求2所述的方法,其中,所述每个类的类权重是通过对每个类的基础类权重进行归一化得到的,所述基础类权重根据下面的等式而得到:
wt,i=(FARt,i)n
其中,t是训练循环序号,i是类序号,FARt,i是在第t次循环训练得到的强分类器对第i类进行分类的虚警率,n是对应于整个训练过程的全局变量,根据各个类的性能而动态地改变。
4、如权利要求3所述的方法,其中,对每个类的基础类权重进行归一化而得到每个类的类权重的步骤包括:在每次循环后基于还没有完成训练的类的基础类权重,通过下式来进行所述归一化:
其中,表示在第t次循环后还没有完成训练的类的基础类权重之和。
5、如权利要求4所述的方法,其中,
n在步骤(2)中被初始化为0;
如果第i类的性能在第t-1次循环最差,并且在第t次循环的性能最差,则n增大预定值;
如果第i类的性能在第t-1次循环最差,在第t次循环不是最差的,则n减小预定值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社;北京三星通信技术研究有限公司,未经三星电子株式会社;北京三星通信技术研究有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710159768.3/1.html,转载请声明来源钻瓜专利网。