[发明专利]一种用线性判别函数设计凸可分分类器的方法无效
申请号: | 200910092168.9 | 申请日: | 2009-09-01 |
公开(公告)号: | CN101655926A | 公开(公告)日: | 2010-02-24 |
发明(设计)人: | 李玉鑑;刘波;杨新武 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06N1/00 | 分类号: | G06N1/00 |
代理公司: | 北京思海天达知识产权代理有限公司 | 代理人: | 张 慧 |
地址: | 100124*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 线性 判别函数 设计 凸可分 分类 方法 | ||
1.一种用线性判别函数设计凸可分分类器的方法,是利用计算机、投影仪和屏幕构建一个硬件设计平台,本发明特征在于,该设计方法依次包括以下步骤:
步骤1;向计算机输入两类n维数据向量样本集合,根据两类集合的大小N和M以及维数分配两组数据存贮空间X={xi,1≤i≤N}和Y={yj,1≤j≤M},把第一类样本的N个向量分别存贮在xi(1≤i≤N)中,把第二类样本的M个向量分别存贮在yj(1≤j≤M)中,其中xi和yj的每个分量可以是随机生成的数据、人工编写的数据或从物理实体上提取的特征数据;
步骤2;对X中的任意向量样本xi(1≤i≤N),计算xi与Y的凸包的最近点并存贮到数据空间vi中;对Y中的任意向量样本yj(1≤j≤M),计算yj与X的凸包的最近点并存贮到数据空间uj中;具体步骤包括:
步骤2.1;从Y中任意选择向量样本存贮到yβ中;
步骤2.2;把yβ存贮到数据空间y*中;
步骤2.3;在Y中选择一个到xi的距离最小的向量样本点,把它存贮到yβ中,这等价于使(xi-yβ)·(xi-yβ)的值最小;
步骤2.4;如果xi和yβ的距离大于等于xi和y*的距离,或者(xi-yβ)·(xi-yβ)的值大于等于(xi-y*)·(xi-y*)的值,则在Y中重新选择向量yμ≠y*,使得xi到y*和yμ连线的垂足yβ=y*+μ·(yμ-y*)在y*到yμ的线段内, 且xi和yβ之间的距离最小,或者(xi-yβ)·(xi-yβ)的值最小;如果(xi-y*)·(xi-y*)-(xi-yβ)·(xi-yβ)的值大于等于ε(ε可取0.001等充分小的正数),返回步骤2.2;
步骤2.5;把yβ存贮到数据空间vi中;
步骤2.6;从X中任意选择向量样本存贮到xα中;
步骤2.7;把xα存贮到x*中;
步骤2.8;在X中选择一个到yj的距离最小的向量样本点,把它存贮到xα中,这等价于使(yj-xα)·(yj-xα)的值最小;
步骤2.9;如果yj和xα的距离大于等于yj和x*的距离,或者(yj-xα)·(yj-xα)的值大于等于(yj-x*)·(yj-x*)的值,则在X中重新选择向量xλ≠x*,使得yj到x*和xλ连线 的垂足xα=x*+λ·(xλ-x*)在x*到xλ的线段内, 且yj和xα之间的距离最小,或者(yj-xα)·(yj-xα)的值最小;如果(yj-x*)·(yj-x*)-(yj-xα)·(yj-xα)的值大于等于ε(ε可取0.001等充分小的正数),返回步骤2.7;
步骤2.10;把xα存贮到数据空间uj中;
步骤3;计算xi与vi的距离 通过比较得到CDXY[i]的最小值,把该最小值赋予变量CDXY=min{CDXY[i],1≤i≤N},其中CDXY称为X关于Y的凸距离;计算yj与uj的距离 通过比较得到CDYX[j]的最小值,把该最小值赋予变量CDYX=min{CDYX[j],1≤j≤M},其中CDYX称为Y关于X的凸距离;
步骤4.如果CDXY大于等于CDYX,则把CDXY存贮到数据空间BCD中,把+1存贮到数据空间BCSD中,即BCSD=+1;否则把CDYX存贮到数据空间BCD中,把-1存贮到数据空间BCSD中,即BCSD=-1;其中BCD的值称为X和Y的凸距离,BCSD的值称为X和Y的最佳凸可分方向;BCSD=+1表示“X关于Y”是最佳凸可分方向,BCSD=-1表示“Y关于X”是最佳凸可分方向;
步骤5;如果X和Y的凸距离BCD小于ε1(ε1可取0.01等充分小的正数),则在计算机的显示器上输出“X和Y凸不可分的”,并通过投影仪将输出信息“X和Y凸不可分的”投影到屏幕上,同时终止其它设计步骤;否则,继续执行其它设计步骤;
步骤6;在区间(0,1]中选择参数γ(一般取γ=1);根据BCSD代表的最佳凸可分方向,设计一组线性判别函数作为两类数据向量样本集X和Y的凸可分分类器;具体步骤包括:
步骤6.1;当BCSD=+1时,把向量样本集合X={xi,1≤i≤N}存贮到数据空间Z中,即Z=X,然后执行下面的步骤:
步骤6.1.1;执行赋值操作l=1;
步骤6.1.2;在Z中选择向量点xm,使得CDXY[m]最小,即
步骤6.1.3;计算wl=(xm-vm)和 把第l个线性判别函 数设计为fl(x)=wl·x+bl;
步骤6.1.4;从Z中删除所有满足条件fl(xi)≥γ·fl(xm)的向量点xi,即把数据空间Z更新为:Z={xi|fl(xi)<γ·fl(xm),xi∈Z};
步骤6.1.5;如果Z中还存有数据,则执行赋值操作l=l+1,返回步骤6.1.2;
步骤6.2;当BCSD=-1时,则把向量样本集合Y={yj,1≤j≤M}存贮到数据空间Z中,即Z=Y,然后执行下面的步骤:
步骤6.2.1;执行赋值操作l=1;
步骤6.2.2;在Z中选择向量点ym,使得CDYX[m]最小,即
步骤6.2.3;计算wl=(ym-um)和 把第l个线性判别函数设计为“fl(x)=wl·x+bl”;
步骤6.2.4;从Z中删除所有满足条件fl(yj)≥γ·fl(ym)的向量点yj,即把数据空间Z更新为:Z={yj|fl(yj)<γ·fl(ym),yj∈Z};
步骤6.2.5;如果Z中还存有数据,则执行赋值操作l=l+1,返回步骤6.2.2;
步骤6.3;把l的当前值存贮在变量L中,L表示X和Y的凸可分分类器中包含的线性判别函数的个数;
步骤7;在计算机上的显示器上输出X和Y的凸可分分类器,即:fl(x)=wl·x+bl(1≤l≤L),并把输出结果通过投影仪投影到屏幕上。
2.根据权利要求1所述的一种用线性判别函数为声纳信号设计凸可分分类器的方法,特征在于,该设计方法可用线性判别函数为声纳信号设计凸可分分类器,其具体方法依次包括以下步骤:
步骤1;向计算机输入两类声纳信号的n维频谱数据向量样本集合,根据两类集合的大小N和M以及维数分配两组数据存贮空间X={xi,1≤i≤N}和Y={yj,1≤j≤M},把第一类样本的N个向量分别存贮在xi(1≤i≤N)中,把第二类样本的M个向量分别 存贮在yj(1≤j≤M)中;其中,第一类声纳信号可以来自矿石,第二类声纳信号可以来自岩石;
步骤2;对X中的任意向量样本xi(1≤i≤N),计算xi与Y的凸包的最近点并存贮到数据空间vi中;对Y中的任意向量样本yj(1≤j≤M),计算yj与X的凸包的最近点并存贮到数据空间uj中;具体步骤包括:
步骤2.1;从Y中任意选择向量样本存贮到yβ中;
步骤2.2;把yβ存贮到数据空间y*中;
步骤2.3;在Y中选择一个到xi的距离最小的向量样本点,把它存贮到yβ中,这等价于使(xi-yβ)·(xi-yβ)的值最小;
步骤2.4;如果xi和yβ的距离大于等于xi和y*的距离,或者(xi-yβ)·(xi-yβ)的值大于等于(xi-y*)·(xi-y*)的值,则在Y中重新选择向量yμ≠y*,使得xi到y*和yμ连线的垂足yβ=y*+μ·(yμ-y*)在y*到yμ的线段内, 且xi和yβ之间的距离最小,或者(xi-yβ)·(xi-yβ)的值最小;如果(xi-y*)·(xi-y*)-(xi-yβ)·(xi-yβ)的值大于等于ε(ε可取0.001等充分小的正数),返回步骤2.2;
步骤2.5;把yβ存贮到数据空间vi中;
步骤2.6;从X中任意选择向量样本存贮到xα中;
步骤2.7;把xα存贮到x*中;
步骤2.8;在X中选择一个到yj的距离最小的向量样本点,把它存贮到xα中,这等价于使(yj-xα)·(yj-xα)的值最小;
步骤2.9;如果yj和xα的距离大于等于yj和x*的距离,或者(yj-xα)·(yj-xα)的值大于等于(yj-x*)·(yj-x*)的值,则在X中重新选择向量xλ≠x*,使得yj到x*和xλ连线的垂足xα=x*+λ·(xλ-x*)在x*到xλ的线段内, 且yj和xα之间的距离最小,或者(yj-xα)·(yj-xα)的值最小;如果(yj-x*).(yj-x*)-(yj-xα)·(yj-xα)的值大于等于ε(ε可取0.001等充分小的正数),返回步骤2.7;
步骤2.10;把xα存贮到数据空间uj中;
步骤3;计算xi与vi的距离 通过比较得到CDXY[i]的最小值,把该最小值赋予变量CDXY=min{CDXY[i],1≤i≤N},其中CDXY称为X关于Y的凸距离;计算yj与uj的距离 通过比较得到CDYX[j]的最小值,把该最小值赋予变量CDYX=min{CDYX[j],1≤j≤M},其中CDYX称为Y关于X的凸距离;
步骤4.如果CDXY大于等于CDYX,则把CDXY存贮到数据空间BCD中,把+1存贮到数据空间BCSD中,即BCSD=+1;否则把CDYX存贮到数据空间BCD中,把-1存贮到数据空间BCSD中,即BCSD=-1;其中BCD的值称为X和Y的凸距离,BCSD的值称为X和Y的最佳凸可分方向;BCSD=+1表示“X关于Y”是最佳凸可分方向,BCSD=-1表示“Y关于X”是最佳凸可分方向;
步骤5;如果X和Y的凸距离BCD小于ε1(ε1可取0.01等充分小的正数),则在计算机的显示器上输出“X和Y凸不可分的”,并通过投影仪将输出信息“X和Y凸不可分的”投影到屏幕上,同时终止其它设计步骤;否则,继续执行其它设计步骤;
步骤6;在区间(0,1]中选择参数γ(一般取γ=1);根据BCSD代表的最佳凸可分方向,设计一组线性判别函数作为两类数据向量样本集X和Y的凸可分分类器;具体步骤包括:
步骤6.1;当BCSD=+1时,把向量样本集合X={xi,1≤i≤N}存贮到数据空间Z中,即Z=X,然后执行下面的步骤:
步骤6.1.1;执行赋值操作l=1;
步骤6.1.2;在Z中选择向量点xm,使得CDXY[m]最小,即
步骤6.1.3;计算wl=(xm-vm)和 把第l个线性判别函数设计为fl(x)=wl·x+bl;
步骤6.1.4;从Z中删除所有满足条件fl(xi)≥γ·fl(xm)的向量点xi,即把数据空间Z更新为:Z={xi|fl(xi)<γ·fl(xm),xi∈Z};
步骤6.1.5;如果Z中还存有数据,则执行赋值操作l=l+1,返回步骤6.1.2;
步骤6.2;当BCSD=-1时,把向量样本集合Y={yj,1≤j≤M}存贮到数据空间Z中,即 Z=Y,然后执行下面的步骤:
步骤6.2.1;执行赋值操作l=1;
步骤6.2.2;在Z中选择向量点ym,使得CDYX[m]最小,即
步骤6.2.3;计算wl=(ym-um)和 把第l个线性判别函数设计为“fl(x)=wl·x+bl”;
步骤6.2.4;从Z中删除所有满足条件fl(yj)≥γ·fl(ym)的向量点yj,即把数据空间Z更新为:Z={yj|fl(yj)<γ·fl(ym),yj∈Z};
步骤6.2.5;如果Z中还存有数据,则执行赋值操作l=l+1,返回步骤6.2.2;
步骤6.3;把l的当前值存贮在变量L中,L表示X和Y的凸可分分类器中包含的线性判别函数的个数;
步骤7;在计算机上的显示器上输出两类声纳信号X和Y的凸可分分类器,即:fl(x)=wl·x+bl(1≤l≤L),并把输出结果通过投影仪投影到屏幕上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910092168.9/1.html,转载请声明来源钻瓜专利网。