[发明专利]一种有限存贮资源下的增量学习分类方法无效
申请号: | 200810246315.9 | 申请日: | 2008-12-30 |
公开(公告)号: | CN101604394A | 公开(公告)日: | 2009-12-16 |
发明(设计)人: | 桑农;程婷;张天序;曹治国;唐奇伶;程志利;张荣 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 华中科技大学专利中心 | 代理人: | 曹葆青 |
地址: | 430074湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种有限存贮资源下的增量学习分类方法,属于模式识别技术领域。该方法采用最小距离分类器,具体为:首先对新样本预分类,将预分类正确的新样本添加到分类器相应子集中,将预分类错误的新样本添加到错误样本集合中,对错误样本集合中的样本进行K-均值聚类。然后分别为分类器和错误样本集合中的各子集筛选代表样本,筛选后将错误样本集合中的子集添加到分类器中,更新分类器,最后采用更新的分类器对新样本分类。本发明通过代表样本的筛选既保存已学习知识,又获取新知识,在降低存储开销和计算开销的基础上具有较高的样本识别准确率。 | ||
搜索关键词: | 一种 有限 存贮 资源 增量 学习 分类 方法 | ||
【主权项】:
1、一种有限存贮资源下的增量学习分类方法,采用最小距离分类器,该方法具体如下:步骤(1)采用当前分类器对所有新样本进行预分类,将预分类正确的新样本添加到当前分类器相应的子集中,将预分类错误的样本添加到集合W中;步骤(2)判断集合W中的样本数是否大于集合样本数预定值,若是,进入步骤(3),否则,结束;步骤(3)在当前分类器的子集Ωi,i=1,2,...m内,m为当前分类器中的子集总数,按照占子集Ωi预分类前已存在样本数的以及子集Ωi预分类后新增样本数的的比例筛选代表样本,N取值为9*ri~10*ri,ri为子集Ωi预分类前已存在的样本数,ki为子集Ωi预分类后新增样本数,pi为子集Ωi筛选后保留的代表样本数,pi满足以下关系:Σ i = 1 m p i ≤ T p 1 V 1 = p 2 V 2 = . . . = p m V m ]]> 其中,T为当前分类器中的各子集代表样本数总和预定值,Vi为子集Ωi的样本协方差矩阵;步骤(4)将集合W中的样本按其类别进行K-均值聚类;步骤(5)在集合W和当前分类器的所有子集中搜索,判断是否存在样本重叠,若存在,则进行子集间调整;若不存在,则进入步骤(6);所述样本重叠是指本应属于第一子集的样本被错误划分到第二子集中,第一子集与第二子集属于不同类别;步骤(6)在集合W中,对于样本数大于等于子集样本数门限值的子集,首先按照占该子集当前样本数1/10~1/9的比例为该子集随机筛选代表样本,再将筛选后的子集添加到当前分类器中,修改分类器结构和参数以更新分类器;步骤(7)采用更新后的分类器对所有新样本进行分类,将分类错误的新样本添加到集合W中,若集合W中的样本数大于新样本保留门限值,则对集合W进行错误样本筛选,否则结束;所述错误样本筛选按照如下方式进行:(7a)计算集合W中各样本的样本距离差与样本距离和;(7b)搜索最大样本距离差对应的样本或者最小样本距离和对应的样本,将其从集合W中去除;(7c)如果集合W中的样本数大于等于新样本保留门限值,返回步骤(7b),否则结束;样本距离差和样本距离和的计算方法为:样本t∈W,在当前分类器内与样本t属于同类别的子集中,搜索这些子集与样本t的最小距离ds_min;在当前分类器内与样本t属于不同类别的子集中,搜索这些子集与样本t的最大距离dt_max,则样本t的样本距离差Δdt-=dt_min-dd_max,样本距离和Δdu+=ds_min+dd_min。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810246315.9/,转载请声明来源钻瓜专利网。