[发明专利]基于主元分析与超限学习机相结合的临床病理数据分类方法在审
申请号: | 201510861654.8 | 申请日: | 2015-12-01 |
公开(公告)号: | CN105528516A | 公开(公告)日: | 2016-04-27 |
发明(设计)人: | 陈翔;庄华亮;何熊熊;伍益明 | 申请(专利权)人: | 三门县人民医院 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06K9/62;G06N3/08 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 317100 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分析 超限 学习机 相结合 临床 病理 数据 分类 方法 | ||
1.一种基于主元分析与超限学习机相结合的临床病理数据分类方法, 其特征在于:所述分类方法包括如下步骤:
1)对临床数据进行归一化,通过主元分析进行特征提取,按特征 显著性进行特征值排序,去除显著性阈值以下的数据维度,达到数据 降维的目的;
2)数据降维后,用超限学习算法训练前馈神经网络分类器;
假设有N个训练样本(xi,ti),其中xi=[xi1xi2xi3...xin]T,i=1,2,3…N,n 为样本维度,ti=[ti1ti2ti3...xim]T,对于一个有个隐层神经元地单隐层网络, 设置其模型为:
其中g(x)为激活函数,超限学习机对激活函数没有特别的要 求,常见的激活函数有sigmoid函数和tanh函数,wi为输入权重, βi为连接隐层第i个神经元输出权重,
wi=[wi1wi2wi3...win]T(7)
βi=[βi1βi2βi3...βim]T(8)
bi是隐层第i个神经元地阈值,单隐层神经网络的训练目标是要使
得拟合的误差最小,即其范数趋向于0,表示为:
存在βi,wi,bi,使得可进一步表示为为线性方 程:
Hβ=T(10)
H为隐层节点的输出矩阵,β为输出权重矩阵,T为期望输出矩阵,
找到使得:
等价于求解最小化损失函数:
由公式(10)看出一旦输入权重wi和阈值bi被随机确定,隐层的输 出矩阵H便随之确定,单隐层神经网络便转换成了求解线性系统:
Hβ=T
通过广义逆矩阵可求得输出权重矩阵
其中H+为H的广义逆矩阵;
3)运用训练后的前馈神经网络分类器对测试样本进行测试,得分 类结果。
2.如权利要求1所述的基于主元分析与超限学习机相结合的临床病理 数据分类方法,其特征在于:所述步骤1)中,数据降维的过程如下:
假设有一组随机样本为x1,x2,x3,…,xN,xi=[xi1,xi2,xi3,…, xim]T,i=1,2,…,N,m为样本的维数,这组样本的均值标记为
此时,每个维度上的均值均为0;
协方差定义:对于样本X和样本Y,其协方差定义为
当样本为m维数组时,它们的协方差便是协方差矩阵:
令矩阵P为:
由公式(11)和(12)知矩阵P便是这组样本的协方差矩阵,通 过求解协方差矩阵P的特征值和特征向量,并将特征值按照大小进行 排序,
λ1≥λ2≥λ3...≥λM
与之相对应的特征向量为:
e1,e2,e3,...eM
假设存在λi≈0,当i>k时,此时可取λ1,λ2,λ3...λk对应的特征向量 e1,e2,e3...ek,选取的特征向量矩阵与原数据集内积后得到新的降维数据 集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三门县人民医院,未经三门县人民医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510861654.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用