[发明专利]基于主元分析与超限学习机相结合的临床病理数据分类方法在审
申请号: | 201510861654.8 | 申请日: | 2015-12-01 |
公开(公告)号: | CN105528516A | 公开(公告)日: | 2016-04-27 |
发明(设计)人: | 陈翔;庄华亮;何熊熊;伍益明 | 申请(专利权)人: | 三门县人民医院 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06K9/62;G06N3/08 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 317100 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分析 超限 学习机 相结合 临床 病理 数据 分类 方法 | ||
技术领域
本发明涉及一种数据分类技术,具体是一种基于主元分析与超限 学习机相结合的病理数据分类方法,可有效应用于高维临床病理数据 分类和挖掘。
背景技术
临床生理指标是医疗诊断、医治、预后等行医基本依据。临床数据 维度很高,医生确诊时,往往利用其专业医学知识和诊断经验,做出 推测。这种诊断经验是一种直觉性知识与后天训练综合能力,是医生 在多年临床诊断的经验中积累起来的。但是疾病的内在机理错综复杂, 各种因素之间会互相影响,其与人体的关系也是错综复杂不可预知, 其中交织着大量的非线性关系,如果能运用自主算法发掘数据内在特 征,实现临床数据有效分类,将可以为医生的诊治策略提供有益的提 示和补充。
医疗信息数据挖掘与应用近年来已受到广泛关注,相关众多技术应 用中,数据提取和分类算法速度,是关乎相关技术性能的两个重要方 面。前面提到临床生理数据往往维度较高,而进行算法优化过程常涉 及到矩阵求逆等运算,造成计算量巨大的瓶颈效应。而数据分类模型 往往又是数据驱动型黑箱,需采用迭代学习方法解决,又进一步加剧 计算量瓶颈效应,给算法应用造成困难。
发明内容
为了克服已有医疗信息数据挖掘方式的维度较高、计算复杂、分 类效果较差的不足,本发明提供了一种有效降低维度、简化计算、分类 效果良好的基于主元分析与超限学习机相结合的临床病理数据分类方 法。
本发明解决其技术问题所采用的技术方案是:
一种基于主元分析与超限学习机相结合的临床病理数据分类方法, 所述分类方法包括如下步骤:
1)对临床数据进行归一化,通过主元分析进行特征提取,按特征 显著性进行特征值排序,去除显著性阈值以下的数据维度,达到数据 降维的目的;
2)数据降维后,用超限学习算法训练前馈神经网络分类器;
假设有N个训练样本(xi,ti),其中xi=[xi1xi2xi3…xin]T,i=1,2,3…N,n为样本维度,ti=[ti1ti2ti3…xim]T,对于一个有个隐层神经元地单隐层网络,设置其模型为:
其中g(x)为激活函数,超限学习机对激活函数没有特别的要 求,常见的激活函数有sigmoid函数和tanh函数,wi为输入权重, βi为连接隐层第i个神经元输出权重,
wi=[wi1wi2wi3…xin]T(7)
βi=[βi1βi2βi3…βim]T(8)
bi是隐层第i个神经元地阈值,单隐层神经网络的训练目标是要使 得拟合的误差最小,即其范数趋向于0,表示为:
存在βi,wi,bi,使得可进一步表示为为线性方程:
Hβ=T(10)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三门县人民医院,未经三门县人民医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510861654.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用