[发明专利]基于样本先验信息的支持向量机核函数选择方法及应用有效
申请号: | 201310475813.1 | 申请日: | 2013-10-13 |
公开(公告)号: | CN103489007A | 公开(公告)日: | 2014-01-01 |
发明(设计)人: | 梁礼明;钟震;杨国亮;葛继;翁发禄 | 申请(专利权)人: | 江西理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 赣州凌云专利事务所 36116 | 代理人: | 曾上 |
地址: | 341000 *** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 样本 先验 信息 支持 向量 函数 选择 方法 应用 | ||
技术领域
本发明涉及一种基于样本数据先验信息的支持向量机核函数选择方法及应用,尤其适用于实时在线的支持向量机模型预测控制场所。
背景技术
支持向量机(Support Vector Machine,SVM)是20世纪90年代Vapnik基于统计学习理论提出的一种新的机器学习方法。与传统统计学相比,支持向量机有完备的理论基础和严格的理论体系,能够解决有限样本的学习问题,具有很强的泛化能力。由于这一方法具有许多优良特性,并在不少领域如模式识别、回归估计、数据挖掘、生物信息学等领域均取得成功的应用。SVM建立在结构风险最小化原则基础之上,其核心思想之一是引入核函数技术,巧妙地解决了在高维特征空间中计算的“维数灾难”等问题。然而,不同的核函数所呈现出的特性各异,选择不同的核函数会导致SVM的推广性能有所不同。目前,如何针对具体问题选择(或构造)合适的核函数,缺乏相应的理论指导,存在很大的随意性和局限性,也是SVM应用领域遇到的一个重大难题。因此,构建一种能充分挖掘给定具体问题的样本数据先验信息,以及结合核函数蕴藏的度量特征进行SVM核函数选择机制,对于SVM技术的发展和核方法的完善有着积极的指导意义和实用价值。
发明内容
本发明的目的是提供一种基于样本先验信息的支持向量机核函数选择方法及应用,从样本数据先验信息出发构建一种有监督的SVM核函数选择机制,完善SVM核函数选择方法,有助于SVM学习能力和泛化能力的提高。
本发明的技术方案:一种基于样本先验信息的支持向量机核函数选择方法,包括如下步骤:
步骤1.输入样本数据其中Rn为n维数据空间,并对X进行变换使数据的范数小于1;
步骤2.对给定样本数据进行超球体的数学描述以及确定超球体的重心O和半径R;
步骤3.建立样本分布能量熵函数,并计算各样本的能量熵;
步骤4.构建样本分布判别函数及计算其判别结果;
步骤5.根据其判别结果与核函数性质(如黎曼度量、距离度量等)的相似性选择核函数类型;
步骤6.合理确定样本训练集和测试集后,SVM模型及参数优化;
步骤7.输出预测结果。
一种基于样本先验信息的支持向量机核函数选择方法在印度肝脏病人数据集、天平平衡测量数据集、澳大利亚的信用审批数据集、三连棋游戏结局数据集得到应用。
本发明构建了一种基于样本先验信息进行SVM核函数选择的机制,克服了传统的支持向量机模型选择方法中人为指定核函数类型而导致模型不能达到最优性能的缺点,提高了SVM学习能力和泛化能力,并具有运算速度快、非常适合实时在线SVM模型预测控制场所等特点。
具体实施方式
下面结合具体实例对本发明作进一步说明。
①所涉及的实例均来自UCI基准库,且为带标签的数据;
②以具有全局特性的多项式核函数和局部特性的径向基核函数为例进行预测结果比较;
③实例中第i个样本的能量熵函数取其中dio为第i个样本与重心O的欧氏距离;
④实例中样本分布判别函数定义为式中α为阈值,l为样本总数,l*为样本中的个数。结合核函数所蕴藏的度量特性,实例中取α=0.5为临界点。当计算出α>0.5,则判断该样本数据呈局部分布特性;当α≤0.5,则判断该样本数据呈全局分布特性。
⑤训练集与测试集的数据样本数量按照8:2比例予以随机划分;
⑥实例中SVM模型参数优化均采取粒子群算法(PSO)进行寻优;
⑦百分数均为SVM模型输出结果预测准确率。
实例1:印度肝脏病人数据集(Indian Liver Patient Dataset)
A步骤:样本共有579个数据,维数为10。经数据预处理后计算出超球体的重心O坐标为(0.5058,0.0000,0.1073,0.1786,0.085,0.3473,0.1652,0.4493,0.5326,0.4500),R=0.4984,α=0.9048。
由此判断该样本数据呈局部分布特性,则选取具有局部特性的径向基核函数为SVM核函数类型。
B步骤:按照已知样本的80%作为训练集、20%作为测试集,则取样本中的464个作为训练集、115组做为测试集。
C步骤:随机选出3组数据:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西理工大学,未经江西理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310475813.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗开裂皮革的生产方法
- 下一篇:喷头
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置