[发明专利]一种用线性判别函数设计凸可分分类器的方法无效
申请号: | 200910092168.9 | 申请日: | 2009-09-01 |
公开(公告)号: | CN101655926A | 公开(公告)日: | 2010-02-24 |
发明(设计)人: | 李玉鑑;刘波;杨新武 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06N1/00 | 分类号: | G06N1/00 |
代理公司: | 北京思海天达知识产权代理有限公司 | 代理人: | 张 慧 |
地址: | 100124*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用线性判别函数设计凸可分分类器的方法,依次包括以下步骤:输入两类数据向量样本集合X和Y;计算X中的每个点到Y的凸包的最近点,Y中的每个点到X的凸包的最近点,X关于Y的凸距离,Y关于X的凸距离,X和Y的凸距离以及X和Y的最佳凸可分方向;在区间(0,1]中选择参数γ,并根据X和Y的最佳凸可分方向,构造一组线性判别函数设计X和Y的凸可分分类器;本发明在解决凸可分分类问题时,不需要选择核函数,也不需要求解二次规划问题,编程实现容易,运行效率较高,泛化能力较强,而且能够明确判定两类数据向量样本集合是凸可分。 | ||
搜索关键词: | 一种 线性 判别函数 设计 凸可分 分类 方法 | ||
【主权项】:
1、一种用线性判别函数设计凸可分分类器的方法,是利用计算机、投影仪和屏幕构建一个硬件设计平台,本发明特征在于,该设计方法依次包括以下步骤:步骤1;向计算机输入两类n维数据向量样本集合,根据两类集合的大小N和M以及维数分配两组数据存贮空间X={xi,1≤i≤N}和Y={yj,1≤j≤M},把第一类样本的N个向量分别存贮在xi(1≤i≤N)中,把第二类样本的M个向量分别存贮在yj(1≤j≤M)中,其中xi和yj的每个分量可以是随机生成的数据、人工编写的数据或从物理实体上提取的特征数据;比如,在对某两种或多种植物设计凸可分分类器时,可以选取萼片长度、萼片宽度、花瓣长度和花瓣宽度这4个特征构成数据向量,xi的4个分量分别表示一种植物样本的萼片长度、萼片宽度、花瓣长度和花瓣宽度,yj的4个分量则分别表示另一种或另外多种植物样本的萼片长度、萼片宽度、花瓣长度和花瓣宽度;步骤2;对X中的任意向量样本xi(1≤i≤N),计算xi与Y的凸包的最近点并存贮到数据空间vi中;对Y中的任意向量样本yj(1≤j≤M),计算yj与X的凸包的最近点并存贮到数据空间uj中;具体步骤包括:步骤2.1;从Y中任意选择向量样本存贮到yβ中;步骤2.2;把yβ存贮到数据空间y*中;步骤2.3;在Y中选择一个到xi的距离最小的向量样本点,把它存贮到yβ中,这等价于使(xi-yβ)·(xi-yβ)的值最小;步骤2.4;如果xi和yβ的距离大于等于xi和y*的距离,或者(xi-yβ)·(xi-yβ)的值大于等于(xi-y*)·(xi-y*)的值,则在Y中重新选择向量yμ≠y*,使得xi到y*和yμ连线的垂足yβ=y*+μ·(yμ-y*)在y*到yμ的线段内,且xi和yβ之间的距离最小,或者(xi-yβ)·(xi-yβ)的值最小;步骤2.5;如果xi和y*的距离至少略大于xi和yβ的距离,或者(xi-y*)·(xi-y*)-(xi-yβ)·(xi-yβ)的值大于等于ε(ε可取0.001等充分小的正数),返回步骤2.2;步骤2.6;把yβ存贮到数据空间vi中;步骤2.7;从X中任意选择向量样本存贮到xα中;步骤2.8;把xα存贮到x*中;步骤2.9;在X中选择一个到yj的距离最小的向量样本点,把它存贮到xα中,这等价于使(yj-xα)·(yj-xα)的值最小;步骤2.10;如果yj和xα的距离大于等于yj和x*的距离,或者(yj-xα)·(yj-xα)的值大于等于(yj-x*)·(yj-x*)的值,则在X中重新选择向量xλ≠x*,使得yj到x*和xλ连线的垂足xα=x*+λ·(xλ-x*)在x*到xλ的线段内,且yj和xα之间的距离最小,或者(yj-xα)·(yj-xα)的值最小;步骤2.11;如果yj和x*的距离至少略大于yj和xα的距离,或者(yj-x*)·(yj-x*)-(yj-xα)·(yj-xα)的值大于等于ε(ε可取0.001等充分小的正数),返回步骤2.8;步骤2.12;把xα存贮到数据空间uj中;步骤3;计算xi与vi的距离通过比较得到CDXY[i]的最小值,把该最小值赋予变量CDXY=min{CDXY[i],1≤i≤N},其中CDXY称为X关于Y的凸距离;计算yj与uj的距离通过比较得到CDYX[j]的最小值,把该最小值赋予变量CDYX=min{CDYX[j],1≤j≤M},其中CDYX称为Y关于X的凸距离;步骤4.如果CDXY大于等于CDYX,则把CDXY存贮到数据空间BCD中,把+1存贮到数据空间BCSD中,即BCSD=+1;否则把CDYX存贮到数据空间BCD中,把-1存贮到数据空间BCSD中,即BCSD=-1;其中BCD的值称为X和Y的凸距离,BCSD的值称为X和Y的最佳凸可分方向;BCSD=+1表示“X关于Y”是最佳凸可分方向,BCSD=-1表示“Y关于X”是最佳凸可分方向;步骤5;如果X和Y的凸距离BCD小于ε1(ε1可取0.01等充分小的正数),则在计算机的显示器上输出“X和Y凸不可分的”,并通过投影仪将输出信息“X和Y凸不可分的”投影到屏幕上,同时终止其它设计步骤;否则,继续执行其它设计步骤;步骤6;在区间(0,1]中选择参数γ(一般取γ=1);根据BCSD代表的最佳凸可分方向,设计一组线性判别函数作为两类数据向量样本集X和Y的凸可分分类器;具体步骤包括:步骤6.1;如果BCSD=+1,则把向量样本集合X={xi,1≤i≤N}存贮到数据空间Z中,即Z=X,然后执行下面的步骤:步骤6.1.1;执行赋值操作l=1;步骤6.1.2;在Z中选择向量点xm,使得CDXY[m]最小,即CD XY [ m ] = min i { CD XY [ i ] = ( x i - v i ) · ( x i - v i ) , 1 ≤ i ≤ N , x i ∈ Z } ; ]]> 步骤6.1.3;计算wl=(xm-vm)和把第l个线性判别函数设计为fl(x)=wl·x+bl;步骤6.1.4;从Z中删除所有满足条件fl(xi)≥γ·fl(xm)的向量点xi,即把数据空间Z更新为:Z={xi|fl(xi)<γ·fl(xm),xi∈Z};步骤6.1.5;如果Z中还存有数据,则执行赋值操作l=l+1,返回步骤6.1.2;步骤6.2;如果BCSD=-1,则把向量样本集合Y={yj,1≤j≤M}存贮到数据空间Z中,即Z=Y,然后执行下面的步骤:步骤6.2.1;执行赋值操作l=1;步骤6.2.2;在Z中选择向量点ym,使得CDYX[m]最小,即CD YX [ m ] = min j { CD YX [ j ] = ( y j - u j ) · ( y j - u j ) , 1 ≤ j ≤ M , y j ∈ Z } ; ]]> 步骤6.2.3;计算wl=(ym-um)和把第l个线性判别函数设计为“fl(x)=wl·x+bl”;步骤6.2.4;从Z中删除所有满足条件fl(yj)≥γ·fl(ym)的向量点yj,即把数据空间Z更新为:Z={yj|fl(yj)<γ·fl(ym),yj∈Z};步骤6.2.5;如果Z中还存有数据,则执行赋值操作l=l+1,返回步骤6.2.2;步骤6.3;把l的当前值存贮在变量L中,L表示X和Y的凸可分分类器中包含的线性判别函数的个数;步骤7;在计算机上的显示器上输出X和Y的凸可分分类器,即:fl(x)=wl·x+fl(1≤l≤L),并把输出结果通过投影仪投影到屏幕上。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910092168.9/,转载请声明来源钻瓜专利网。