[发明专利]一种2型糖尿病风险状态判定方法无效
申请号: | 201210431592.3 | 申请日: | 2012-11-01 |
公开(公告)号: | CN102930163A | 公开(公告)日: | 2013-02-13 |
发明(设计)人: | 罗森林;张铁梅;陈峰 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 糖尿病 风险 状态 判定 方法 | ||
技术领域
本发明涉及一种2型糖尿病风险状态判定方法,属于生物医学技术领域。
背景技术
随着社会经济发展,生活方式改变以及人口老龄化等危险因素迅速增加,2型糖尿病及其并发症患病率迅速上升。据2008年调查结果显示,在20岁以上的成人中,年龄标化的糖尿病的患病率为9.7%,糖尿病前期的比例更高达15.5%。因此,早期对糖尿病危险人群采取预防措施,做到未病先防是控制糖尿病患病率的有效途径。糖尿病风险状态判定工具作为人群筛查的重要工具,正越来越受到医学人员的重视。糖尿病风险状态判定主要倾向于对患病风险状态的评估,是指对个人所处的风险状态所作的分析和推断,是风险决策的基础,糖尿病风险状态判定模型能有效并准确预测个人发生疾病的风险状态,可以减轻医学人员的工作量,同时也可以准确的针对高风险人群采取针对性的预防措施。
2型糖尿病风险状态判定需要解决2个基本问题:1.如何提取与2型糖尿病发病紧密相关的关键属性,增强风险判定的普适性;2.如何根据关键属性合理的判定个人发病风险状态。综观现有2型糖尿病风险状态判定方法,通常使用的方法有:
1.在关键属性提取方面:
根据算法原理一般分为过滤法和包装法,过滤法一般包括以下方法:
(1)Relief方法:该方法是根据统计相关性标准提取关键属性,根据特征值的区分能力来评价特征的相关度,即关键属性应该使同类的样本接近,而使不同类的样本之间远离,基本思想是:对样本进行抽样,在根据抽取的样本与同类、不同类的两个最接近样本的差异计算相关度,从而确定每个属性的不同权重。Relief方法选择的关键属性相关性较强,且能够处理离散和连续属性,但该方法不能消除冗余属性,且由于计算样本间距离将产生较大的时间开销,无法满足高维数据关键属性提取的时间性能要求。
(2)主成分分析方法:该方法研究各个属性之间的相关关系,将原来一组具有一定相关性的属性,通过变换成为一组新的属性集合作为关键属性,通过这种变换达到用较少的新属性代替原来较多属性的目的,并且使新属性尽可能多保留原来较多属性反映的信息。但是主成分分析法涉及到特征方程等矩阵运算,算法的时间消耗不能满足高维数据关键属性提取的要求。
(3)粗糙集方法:该方法是在保持属性的分类能力下,不断筛除冗余属性从而获得关键属性集合。粗糙集方法一般根据差别矩阵、属性重要度或JOHNSON约简方法,通过属性依赖程度的不同消除对分类结果影响较低的属性,达到提取关键属性的目的。虽然该方法可以有效地删除不相关属性,但没有考虑噪声数据的影响,并且计算效率低。
(4)信息熵方法:该方法主要用于信息理论中分析信息不确定度,也可用作属性作用度的评价,即关键属性提取。其基本思想是根据计算信息增益等方法划分数据,并从新计算划分后的数据增益,典型方法有ID3和C4.5,但该方法时间复杂度高。
(5)遗传算法:该方法将解表示为以二进制串编码的“染色体”,在执行算法前,给出假设解的“染色体”,然后把这些假设解置于具体问题也即“环境”中,按照一定原则从中选择出较适应环境的编码串模拟生物遗传过程的复制、交叉、变异产生更适应环境的新一代。依此进化,最后就会逐渐收敛到最适应环境的一个编码串上,也即最优解。通过该过程即可提取关键属性。但该方法需要不停迭代计算,算法时间复杂度高,在关键属性提取中很少应用。
包装法:该方法将学习算法作为测试用的黑盒子,利用相关的学习算法对属性子集进行评价,其主要思想是用训练数据和相应的学习算法训练一个分类模型,然后用测试数据来评估这个分类器的分类准确率,通过迭代提取关键属性,同时能够发现比较适合的学习算法以及算法的相关参数设定值。包装法优点是对学习算法的支持度高,缺点是该模型需要耗费大量的时间进行学习和训练,时间复杂度高,效率低,不适用于学习算法经常变动的情况。
2.在风险状态判定方法方面:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210431592.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗慢性盆腔炎的汤剂
- 下一篇:具有电驱动系统的自行车
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用