[发明专利]基于信息增益和在线支持向量机的新型分类器及分类方法有效

专利信息
申请号: 201110458593.2 申请日: 2011-12-31
公开(公告)号: CN102609714B 公开(公告)日: 2017-07-07
发明(设计)人: 孙广路;沈跃伍;齐浩亮 申请(专利权)人: 哈尔滨理工大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 哈尔滨市伟晨专利代理事务所(普通合伙)23209 代理人: 张伟
地址: 150000 黑龙*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要: 基于信息增益和在线支持向量机的新型分类器及分类方法。在近几年学术研究中,尤其是在信息过滤领域,在线支持向量分类器受到部分学者的关注。一种基于信息增益和在线支持向量机的新型分类器的分类方法,本方法包括如下步骤第一步对样本信息进行预处理,获得样本的特征;第二步使用信息增益Information Gain方法计算每个特征的信息量,再根据一定的策略选择所需的特征;第三步根据选择的特征建立能够适应在线支持向量机模型的特征向量;第四步利用在线模型训练基于在线支持向量机的新型分类器;第五步利用分类器分类样本。本发明用于文本分类、信息过滤。
搜索关键词: 基于 信息 增益 在线 支持 向量 新型 分类 方法
【主权项】:
一种基于信息增益和在线支持向量机的新型分类器的分类方法,其特征是:基于信息增益和在线支持向量机的新型分类器包括样本预测器,所述的样本预测器连接样本特征选择器,所述的样本特征选择器连接空间向量生成器,所述的空间向量生成器连接在线支持向量机训练器,所述的样本预测器与所述的样本特征选择器与所述的空间向量生成器与所述的在线支持向量机训练器均连接中央处理器;所述的中央处理器包括控制单元,所述的控制单元连接预处理器和算术逻辑单元;先将代码从磁盘存储器中读入随机访问存储器RAM中,并在随机访问存储器中建立程序编译和运行所需的堆、栈、自由存储区、静态存储区和常量存储区;程序编译之后,在随机访问存储器中创建预处理器、特征选择器、建立特征空间器、样本预测器以及样本训练器;预处理器处理的样本是网络层的数据包或是磁盘存储器上的数据;预处理器获得数据之后,将数据通过总线发送给中央处理器(CPU)中的控制单元(Control Unit),控制单元再根据指令将数据送给算术逻辑单元(ALU),算术逻辑单元将处理的结果通过控制单元、总线发送给预处理器,预处理器将全部处理完的结果返回给特征选择器,数据经过特征选择器、建立特征空间向量器、样本预测器和样本训练器之后输出结果;特征选择器、建立特征空间向量器、样本预测器和样本训练器的处理过程和预处理器一样,都是按照编写好的程序和指令,通过总线传送给中央处理器的控制单元,控制单元控制算术逻辑单元处理数据,并将处理好的结果传送给样本预测器、样本特征选择器、空间向量生成器和在线支持向量机训练器;本分类方法包括如下步骤:第一步对样本信息进行预处理,获得样本的特征;第二步使用信息增益Information Gain方法计算每个特征的信息量,再根据一定的策略选择所需的特征;第三步根据选择的特征建立能够适应在线支持向量机模型的特征空间向量;第四步利用在线模型训练基于在线支持向量机的新型分类器;第五步利用分类器分类样本;所述的第一步的选择样本有效特征是使用信息增益策略来计算每个特征在所出现的样本中信息量大小,根据得到每个特征信息增益量来判断是否需要选择该特征;所述的第三步建立特征空间向量是根据选择的样本特征,通过哈希表进行特征映射,将其转为在线支持向量机能够识别的特征空间向量;所述的第四步在线支持向量机是将支持向量机SVM转化成在线模式,在线模式是分类和训练同时进行;所述的基于在线支持向量机的新型分类器中放宽了在线支持向量机的条件,所述放宽了在线支持向量机的条件包括放宽了多次迭代寻找最优分类界面的条件;所述的新型分类器包括首先对样本信息预处理,获取样本的特征;然后选择样本有效的特征;之后建立特征空间向量;最后利用基于在线支持向量机的分类器对样本进行分类和训练;所述的新型分类器中训练部分样本是最近出现的n个样本,并不是全部样本;所述的信息增益(Information Gain)方法的计算公式是InforGain(T)=-Σc∈{c1,c2}p(c)log2p(c)+p(t)Σc∈{c1,c2}p(c|t)log2p(c|t)+p(t‾)Σc∈{c1,c2}p(c|t‾)log2p(c|t‾).]]>
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201110458593.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top