[发明专利]基于多标记特征选择及分类的中医临床大数据存储方法有效
申请号: | 201810879094.2 | 申请日: | 2018-08-03 |
公开(公告)号: | CN109119133B | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 罗志明;孙振强;曹冬林;苏松志;李绍滋 | 申请(专利权)人: | 厦门大学 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H50/70;G06K9/62 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森;曾权 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 标记 特征 选择 分类 中医 临床 数据 存储 方法 | ||
基于多标记特征选择及分类的中医临床大数据存储方法,涉及大数据挖掘与中医数字化的交叉技术应用领域。对患者进行信息采集,根据不同患者症状进行量化打分,并对其赋予对应的多类标签;对采集到的患者数据进行归一化处理,将标记数据集进行向量化处理,得到标准的多标记数据集,并将多标记数据集划分为训练集和测试集以验证算法有效性;计算训练集进行特征选择时所需相关矩阵,使用罚函数法计算全局最优特征权重分配;选取权重最大的前K个特征子集,使用MLkNN方法得到测试集预测结果,并选取最优特征子集进行新患者病情预测。
技术领域
本发明涉及大数据挖掘与中医数字化的交叉技术应用领域,尤其是涉及通过使用信息熵及全局优化技术,结合中医临床数字化发展体系,针对中医临床数据具有高冗余性的特点进行数据压缩存储的基于多标记特征选择及分类的中医临床大数据存储方法。
背景技术
多标记学习(Multi-label Learning)的研究最初萌芽于文档分类问题(张敏灵.多标记学习:问题、算法与数据[J].2011),与传统监督学习相比,类别标记从单一变为多个组成的子集,使用传统单标记分类方法将在存储空间和计算开销上急剧膨胀,因此多标记学习应运而生,为解决类似问题提供解决方案,并在多媒体内容标注、生物信息学、信息检索等领域得到了广泛关注和应用。
特征选择(Feature Selection)(Lee J,Kim D W.Feature selection formulti-label classification using multivariate mutual information[J].PatternRecognition Letters,2013,34(3):349-357),由于维度灾难问题在大数据应用领域普遍存在,对数据分类,分析结果造成极大影响,因此对数据维度进行约减具有十分重要的意义。特征选择是维度约减方法中的一个重要分支,由于其具有更好的解释性和易操作性,被广泛应用于大数据挖掘和机器学习中的数据预处理当中,并取得了出色的效果。
中医临床数字化是基于中医学的理论,研究诊察病情、判断病种、辨别证候的基础理论、基本知识和基本技能与人工智能、大数据分析之上的一种交叉研究领域。它是中医学专业的基础理论与大数据,人工智能之间的桥梁,是传统中医发展的必然方向。
中医诊断学与多标记问题包括:1)中医数字化大数据存储问题为天然的多标记问题,一个患者根据不同的诊疗特征可能被诊断为不同的疾病;2)中医数据存储过程中为保证数据选择及后续使用的鲁棒性,其诊断特征存在比较多的冗余信息,因此对其进行特征选择十分必要;3)目前比较少见从多标记特征选择问题角度出发解决中医数字化大数据存储问题。
发明内容
本发明的目的在于从多标记特征选择角度解决中医大数据中高度冗余问题,为后续诊断患者数据并进行挖掘提供保证,同时减少数据存储成本,提高数据可用性的基于多标记特征选择及分类的中医临床大数据存储方法。
本发明包括以下步骤:
1)对患者进行信息采集,根据不同患者症状进行量化打分,并对其赋予对应的多类标签;
2)对采集到的患者数据进行归一化处理,将标记数据集进行向量化处理,得到标准的多标记数据集,并将多标记数据集划分为训练集和测试集以验证算法有效性;
3)计算训练集进行特征选择时所需相关矩阵,使用罚函数法计算全局最优特征权重分配;
4)选取权重最大的前K个特征子集,使用MLkNN方法得到测试集预测结果,并选取最优特征子集进行新患者病情预测。
在步骤1)中,所述对患者进行信息采集,根据不同患者症状进行量化打分,并对其赋予对应的多类标签的具体方法可为:
(1)医生对患者进行症状询问,并对患者病情进行标记;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810879094.2/2.html,转载请声明来源钻瓜专利网。