[发明专利]一种用线性判别函数设计凸可分分类器的方法无效

专利信息
申请号: 200910092168.9 申请日: 2009-09-01
公开(公告)号: CN101655926A 公开(公告)日: 2010-02-24
发明(设计)人: 李玉鑑;刘波;杨新武 申请(专利权)人: 北京工业大学
主分类号: G06N1/00 分类号: G06N1/00
代理公司: 北京思海天达知识产权代理有限公司 代理人: 张 慧
地址: 100124*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种用线性判别函数设计凸可分分类器的方法,依次包括以下步骤:输入两类数据向量样本集合X和Y;计算X中的每个点到Y的凸包的最近点,Y中的每个点到X的凸包的最近点,X关于Y的凸距离,Y关于X的凸距离,X和Y的凸距离以及X和Y的最佳凸可分方向;在区间(0,1]中选择参数γ,并根据X和Y的最佳凸可分方向,构造一组线性判别函数设计X和Y的凸可分分类器;本发明在解决凸可分分类问题时,不需要选择核函数,也不需要求解二次规划问题,编程实现容易,运行效率较高,泛化能力较强,而且能够明确判定两类数据向量样本集合是凸可分。
搜索关键词: 一种 线性 判别函数 设计 凸可分 分类 方法
【主权项】:
1、一种用线性判别函数设计凸可分分类器的方法,是利用计算机、投影仪和屏幕构建一个硬件设计平台,本发明特征在于,该设计方法依次包括以下步骤:步骤1;向计算机输入两类n维数据向量样本集合,根据两类集合的大小N和M以及维数分配两组数据存贮空间X={xi,1≤i≤N}和Y={yj,1≤j≤M},把第一类样本的N个向量分别存贮在xi(1≤i≤N)中,把第二类样本的M个向量分别存贮在yj(1≤j≤M)中,其中xi和yj的每个分量可以是随机生成的数据、人工编写的数据或从物理实体上提取的特征数据;比如,在对某两种或多种植物设计凸可分分类器时,可以选取萼片长度、萼片宽度、花瓣长度和花瓣宽度这4个特征构成数据向量,xi的4个分量分别表示一种植物样本的萼片长度、萼片宽度、花瓣长度和花瓣宽度,yj的4个分量则分别表示另一种或另外多种植物样本的萼片长度、萼片宽度、花瓣长度和花瓣宽度;步骤2;对X中的任意向量样本xi(1≤i≤N),计算xi与Y的凸包的最近点并存贮到数据空间vi中;对Y中的任意向量样本yj(1≤j≤M),计算yj与X的凸包的最近点并存贮到数据空间uj中;具体步骤包括:步骤2.1;从Y中任意选择向量样本存贮到yβ中;步骤2.2;把yβ存贮到数据空间y*中;步骤2.3;在Y中选择一个到xi的距离最小的向量样本点,把它存贮到yβ中,这等价于使(xi-yβ)·(xi-yβ)的值最小;步骤2.4;如果xi和yβ的距离大于等于xi和y的距离,或者(xi-yβ)·(xi-yβ)的值大于等于(xi-y)·(xi-y)的值,则在Y中重新选择向量yμ≠y,使得xi到y和yμ连线的垂足yβ=y+μ·(yμ-y)在y到yμ的线段内,且xi和yβ之间的距离最小,或者(xi-yβ)·(xi-yβ)的值最小;步骤2.5;如果xi和y的距离至少略大于xi和yβ的距离,或者(xi-y)·(xi-y)-(xi-yβ)·(xi-yβ)的值大于等于ε(ε可取0.001等充分小的正数),返回步骤2.2;步骤2.6;把yβ存贮到数据空间vi中;步骤2.7;从X中任意选择向量样本存贮到xα中;步骤2.8;把xα存贮到x*中;步骤2.9;在X中选择一个到yj的距离最小的向量样本点,把它存贮到xα中,这等价于使(yj-xα)·(yj-xα)的值最小;步骤2.10;如果yj和xα的距离大于等于yj和x*的距离,或者(yj-xα)·(yj-xα)的值大于等于(yj-x*)·(yj-x*)的值,则在X中重新选择向量xλ≠x*,使得yj到x和xλ连线的垂足xα=x+λ·(xλ-x)在x到xλ的线段内,且yj和xα之间的距离最小,或者(yj-xα)·(yj-xα)的值最小;步骤2.11;如果yj和x*的距离至少略大于yj和xα的距离,或者(yj-x*)·(yj-x*)-(yj-xα)·(yj-xα)的值大于等于ε(ε可取0.001等充分小的正数),返回步骤2.8;步骤2.12;把xα存贮到数据空间uj中;步骤3;计算xi与vi的距离通过比较得到CDXY[i]的最小值,把该最小值赋予变量CDXY=min{CDXY[i],1≤i≤N},其中CDXY称为X关于Y的凸距离;计算yj与uj的距离通过比较得到CDYX[j]的最小值,把该最小值赋予变量CDYX=min{CDYX[j],1≤j≤M},其中CDYX称为Y关于X的凸距离;步骤4.如果CDXY大于等于CDYX,则把CDXY存贮到数据空间BCD中,把+1存贮到数据空间BCSD中,即BCSD=+1;否则把CDYX存贮到数据空间BCD中,把-1存贮到数据空间BCSD中,即BCSD=-1;其中BCD的值称为X和Y的凸距离,BCSD的值称为X和Y的最佳凸可分方向;BCSD=+1表示“X关于Y”是最佳凸可分方向,BCSD=-1表示“Y关于X”是最佳凸可分方向;步骤5;如果X和Y的凸距离BCD小于ε11可取0.01等充分小的正数),则在计算机的显示器上输出“X和Y凸不可分的”,并通过投影仪将输出信息“X和Y凸不可分的”投影到屏幕上,同时终止其它设计步骤;否则,继续执行其它设计步骤;步骤6;在区间(0,1]中选择参数γ(一般取γ=1);根据BCSD代表的最佳凸可分方向,设计一组线性判别函数作为两类数据向量样本集X和Y的凸可分分类器;具体步骤包括:步骤6.1;如果BCSD=+1,则把向量样本集合X={xi,1≤i≤N}存贮到数据空间Z中,即Z=X,然后执行下面的步骤:步骤6.1.1;执行赋值操作l=1;步骤6.1.2;在Z中选择向量点xm,使得CDXY[m]最小,即CDXY[m]=mini{CDXY[i]=(xi-vi)·(xi-vi),1iN,xiZ};]]>步骤6.1.3;计算wl=(xm-vm)和把第l个线性判别函数设计为fl(x)=wl·x+bl;步骤6.1.4;从Z中删除所有满足条件fl(xi)≥γ·fl(xm)的向量点xi,即把数据空间Z更新为:Z={xi|fl(xi)<γ·fl(xm),xi∈Z};步骤6.1.5;如果Z中还存有数据,则执行赋值操作l=l+1,返回步骤6.1.2;步骤6.2;如果BCSD=-1,则把向量样本集合Y={yj,1≤j≤M}存贮到数据空间Z中,即Z=Y,然后执行下面的步骤:步骤6.2.1;执行赋值操作l=1;步骤6.2.2;在Z中选择向量点ym,使得CDYX[m]最小,即CDYX[m]=minj{CDYX[j]=(yj-uj)·(yj-uj),1jM,yjZ};]]>步骤6.2.3;计算wl=(ym-um)和把第l个线性判别函数设计为“fl(x)=wl·x+bl”;步骤6.2.4;从Z中删除所有满足条件fl(yj)≥γ·fl(ym)的向量点yj,即把数据空间Z更新为:Z={yj|fl(yj)<γ·fl(ym),yj∈Z};步骤6.2.5;如果Z中还存有数据,则执行赋值操作l=l+1,返回步骤6.2.2;步骤6.3;把l的当前值存贮在变量L中,L表示X和Y的凸可分分类器中包含的线性判别函数的个数;步骤7;在计算机上的显示器上输出X和Y的凸可分分类器,即:fl(x)=wl·x+fl(1≤l≤L),并把输出结果通过投影仪投影到屏幕上。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200910092168.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top