[发明专利]一种基于决策树的脑电信号特征选择方法有效
申请号: | 201410112806.X | 申请日: | 2014-03-24 |
公开(公告)号: | CN103876734A | 公开(公告)日: | 2014-06-25 |
发明(设计)人: | 段立娟;葛卉;周海燕;乔元华;马伟;苗军 | 申请(专利权)人: | 北京工业大学 |
主分类号: | A61B5/0476 | 分类号: | A61B5/0476 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 决策树 电信号 特征 选择 方法 | ||
1.一种基于决策树的脑电信号特征选择方法,其特征在于,包括以下步骤:
步骤1,采集数据;
受试者佩戴电极帽,想象上下移动屏幕上的光标;采集受试者脑电信号,得到训练样本集和测试样本集;
步骤2,进行数据预处理;
步骤2.1,数据重组;
将采集到的一个电极的训练样本集表示为一个m*p的矩阵,其中m表示训练样本集的样本量,p=r*t为样本集的维度,其中r表示采样率,t表示采样时间;将采集到的所有电极的训练样本集,按样本量不变、维度增加的方法重组成一个训练数据集,即重组成一个m*k的矩阵,k=a*p,其中a为记录电极的个数;
将采集到的一个电极的测试样本集表示为一个n*p的矩阵,其中n表示测试样本集的样本量;按照与训练样本集相同的处理方式,将所有电极的测试样本集重组成一个n*k的矩阵;
步骤2.2,数据分组;
将步骤2.1得到的测试数据集和训练数据集按照维度不变、增加样本量的方法组合成一个数据集,即一个h*k的矩阵,h=m+n;然后再将此数据集按样本量平均地分成10份,其中训练数据是一个w*k的矩阵,w=0.9h,测试数据是一个g*k的矩阵,g=0.1h;
步骤3,特征提取;
利用主成分分析法分别对训练数据和测试数据进行特征提取,得到特征向量,即将两个数据集均从k维数据降为d维数据,也就是将每个电极的数据从p维降到q维,其中d=a*q;
步骤4,特征选择;
将特征提取后的特征向量输入到决策树中,进行优势特征选择;
步骤5,进行脑电信号分类;
取出训练数据中c个特征对应的数据,形成新的训练样本,即一个w*c的矩阵;对测试样本做同样的工作,形成新的测试样本,即一个g*c的矩阵;将重组后的优势特征向量,包括训练样本、训练样本标签、测试样本、测试样本标签,输入到支持向量机分类器中,进行脑电信号分类,得到分类正确率;
步骤6,求分类正确率;
轮流选择步骤2.2所述的10份数据中的1份作为测试数据,其它9份作为训练数据,重复步骤3~5,共进行10次实验,求10次实验所得到分类正确率的平均值,得到最终的分类正确率。
2.根据权利要求1所述的一种基于决策树的脑电信号特征选择方法,其特征在于,步骤4所述优势特征选择的方法包括以下步骤:
(1)构造决策树;
以代表训练样本的单个结点开始建树;结点存放的是一个属性;如果样本都在同一个类,则该结点成为树叶,并用该类标记;否则,使用成为信息增益的基于熵的度量为启发信息,选择能够最好地将样本分类的属性,即具有最高信息增益的属性;该属性成为该结点的“测试”或“判定”属性;对测试属性的每个已知的值,创建一个分支,并据此划分样本;重复上述过程,递归地形成每个划分上的样本决策树,当下列条件之一成立时停止:
条件一:给定结点的所有样本属于同一类;
条件二:没有剩余属性可以用来进一步划分样本;在此情况下,采用多数表决,即将给定的结点转换成树叶,用样本中多数所在的类别标记它;
条件三:对于根据测试属性的其中一个已知的值创建的分支中没有样本;在这种情况下,以样本中多数类创建一个树叶;
按照上述方法构造一棵具有非叶结点、分支和树叶的完全决策树;对于d维的训练数据来说,对应有d个属性;树的结点存放着属性Ai,其中i=1,2,…,d;根据分支Ai=aj划分样本,其中aj是属性Ai的一个已知的值,j=1,2,…,w,;树叶存放着结点样本的类别标签;
(2)修剪决策树;
对于完全决策树中的每一个非叶结点的子树,尝试将其替换成一个叶结点,该叶结点的类别用子树所覆盖训练样本中存在最多的那个类来代替,这样就产生了一个简化决策树;然后,比较完全决策树和简化决策树在测试数据集中的表现,如果简化决策树在测试数据集中的错误比较少,并且该子树里面没有包含另外一个具有类似特性的子树,那么该子树就可以替换成叶结点;所述类似特性是指把子树替换成叶结点后其测试数据集误判率降低的特性;以这种自下而上的方式遍历所有的子树,直至没有任何子树可以替换使得测试数据集的表现得以改进时,修剪便终止,得到最终的简化树;
此时简化树有c个非叶结点,对应数据集中的c个属性,即c个特征,称这c个特征为优势特征,而数据集中剩余的特征为非优势特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410112806.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:家用电器的测试电路、装置和系统
- 下一篇:一种小型干式精选机