[发明专利]一种基于层次聚类的检测器训练方法无效

专利信息
申请号: 201210024274.5 申请日: 2012-02-05
公开(公告)号: CN102831431A 公开(公告)日: 2012-12-19
发明(设计)人: 陈文;刘晓洁;李涛;胡晓勤;赵辉 申请(专利权)人: 四川大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 610065 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 层次 检测器 训练 方法
【说明书】:

技术领域

本发明涉及一种检测器训练方法,属于模式识别领域。

背景技术

检测器是模式识别系统中最基本的执行单元,被广泛应用于异常检测、数据分类、疾病诊断等领域。检测器的质量和训练效率直接影响到模式识别系统的性能。传统的检测器生成方法,如Forrest 等人提出的否定选择算法NSA、Gonzalez等提出的实值否定选择算法RNSA,以及Dasgupta等提出的变半径检测器生成方法V-detector采用全部正类样本训练新产生的候选检测器,以排除识别了正类样本的无效检测器。由于传统方法需要计算候选检测器与全部正类样本间的距离,导致检测器的训练时间开销过大,尤其是在大样本空间下训练检测器异常困难,从而极大地限制了模式识别系统的实际应用。

中国专利公开号为201110035696.8的申请案:一种新型人工免疫系统和基于蚁群优化的检测器集优化方法,该方法采用蚁群算法优化检测器,在保持检测器多样性方面取得了一定的效果,但是该方法将检测器与全部正类训练样本进比较,导致检测器训练过程的时间复杂度与样本规模呈指数关系,在大样本空间下检测器训练的时间代价巨大。 

针对上述的缺陷,本发明提出了一种基于层次聚类的检测器生成方法,该方法首先对对正类样本进行层次聚类,随后采用聚类中心代替正类样本对候选检测器进行训练,由于聚类中心的数量远少于正类样本的数量,从而有效地提高了检测器的训练效率。该发明可应用于大样本空间下的模式识别系统,具有广泛的应用前景。 

本发明与现有技术相比具有如下优点: 

1) 检测器生成过程的时间代价更小

本发明在检测器训练之前首先对正类样本进行层次聚类,随后采用聚类中心代替全部正类样本作为训练集对候选检测器进行训练,由于聚类中心的数量远少于正类样本的数量,本发明有效地降低了检测器训练的时间代价,提高了训练效率;

 2) 检测误报率更低

本发明采用聚类中心与聚类半径代替正类数据与正类半径与候选检测器进行匹配,对“识别正类的无效检测器”的界定标准更加严格:检测器只要覆盖了聚类范围(而不是传统的正类范围)就被界定为无效检测器而删除,从而有效地降低了检测器误报率。

在详细阐述本发明前,先做如下定义: 

定义1:所有来自检测空间的特征串组成样本集合U={g|g=(f1,f2…fn),fi∈[0,1]},n为数据维数,fi代表第i个样本属性规范化后的值。

定义2:负类集 代表待检测样本的特征串;正类集 代表其余样本的特征串,正类半径rs∈R+代表正类样本的变化范围,与任意正类样本的距离小于rs的样本为正类元素,且Positive∪Negative=U,Positive∩Negative=Φ。 

定义3:检测器用于识别负类样本:d=<c,r>,其中c∈Nonself,代表检测器位置向量,r∈R+代表检测半径,与d的距离小于r的样本被识别为负类。 

定义4:检测器对负类空间的覆盖率:P=Vcov/Vnegative,其中Vcov为检测器覆盖的负类空间体积,Vnegative为负类样本空间体积。 

发明内容

本发明针对传统的检测器生成方法训练时间代价过高,训练效率过低这一问题,提出了一种新的基于层次聚类的检测器生成方法。本发明的技术思路是:首先提取正类集;其次对正类样本进行层次聚类,将正类样本组织成聚类范围逐层收敛的层次聚类结构;然后采用聚类中心构造训练样本集;随后在包含每一层聚类的最小超立方体内随机产生新的候选检测器中心向量;然后采用聚类中心对候选检测器进行训练,排除中心向量落入聚类范围的无效检测器,保留其余检测器加入检测器集合;最后计算检测器在给定置信度下的覆盖率下限,以覆盖率下限大于给定的期望覆盖率作为中止检测器训练过程的条件。

附图说明

图1是本发明的工作流程图。

图2是正类集提取步骤图。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210024274.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top