[发明专利]特征提取方法、电子装置及医疗案例相似度模型构建方法在审
申请号: | 202010182104.4 | 申请日: | 2020-03-16 |
公开(公告)号: | CN111310857A | 公开(公告)日: | 2020-06-19 |
发明(设计)人: | 杨斌;李琴;吴一多;马婷婷;张建 | 申请(专利权)人: | 青岛百洋智能科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 徐艳艳 |
地址: | 266000 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 提取 方法 电子 装置 医疗 案例 相似 模型 构建 | ||
本发明涉及一种特征提取方法、电子装置及医疗案例相似度模型构建方法,所述特征提取方法含有以下步骤:根据含有本体属性的医疗诊疗案例数据集构建样本训练集,样本总量为P,特征数量为N,设定近邻的样本数量为k;通过构建的改进的ReliefF算法模型计算每个特征相应的权重,并根据每个特征权重的大小对特征进行排序;以权重大于0为条件初步进行特征选择;对初步选择后的特征按照从大到小重新排序,利用FWKNN模型计算准确率,选择准确率最高的特征组合作为最终特征。本发明不改变本体类型数据的特性,选择的最终特征精确性高,应用于医疗案例相似度模型的构建时,提高了医疗案例相似度模型的准确率。
技术领域
本发明属于数据处理技术领域,涉及医疗数据处理技术,具体地说,涉及一种医疗辅助决策模型的特征提取方法、电子装置及医疗案例相似度模型构建方法。
背景技术
基于知识图谱的建模方法是从知识理论的角度建立模型,已经呈为医疗智能辅助决策支撑模型构建的一种重要人工智能(英文:Artificial Intelligence,简称:AI)方法。知识图谱模型的重要特征是概念知识以本体形式存在,即概念以树层级结构进行存储,因此,有些真实世界的医疗病例世界,实际上是本体概念的实例化存在,这些数据具有本体属性,当应用这些数据进行机器学习模型构建的时候,作为本体类型的数据,而非数值型或枚举型的数据,能更好地表达数据的特性,特别是在计算相似度时,本体类型的数据具有本体相似度计算方法。当应用知识图谱和机器学习算法在构建医疗人工智能模型时,真实世界数据中会出现数值型、枚举型、本体型三种数据类型存在,在计算案例相似度时,需要根据数据不同的属性分别计算local相似度。在进行机器学习的相似度计算模型构建之前,需要进行数据特征(属性)的选择,其中包含了本体类型(通过树层级结构描述)和结构数据类型的数据,特征选择的算法必须满足在算法计算过程中一直保持各特征的原有数据类型的特性。
目前,实现本体类型和结构数据类型的融合的特征选择算法较少,在传统的机器学习的特征选择算法中,如Filter方法、Wrapprer方法、Embedded方法等,一般将数据处理成数值类型和枚举类型,有些算法直接将本体类型的数据当作枚举类型来对待,这种做法实际上并未保持本体类型数据的特征,不能在数据处理过程中保持本体类型数据的特性。KNN的特征权重计算方法也有一些常规算法,如Pearson相关系数方法、卡方检验特征权重算法、GA特征权重学习算法、决策树GainRatio、RF误差权重方法等,这些方法的计算过程一般不包含本体类型的数据,因此也是必须将本体类型的数据转换成枚举型的数据类型,不能在数据处理过程中保持本体类型数据的特性。鉴于医疗数据包括了本体类型的数据和结构数据类型的数据,现有特征提取及特征权重计算方法无法满足本体类型数据和结构数据类型融合的多类型数据的特征选择,不能有效保持医疗数据的本体特性,通过该方法构建的医疗辅助决策模型推荐结果并不准确。
发明内容
本发明针对现有技术存在的上述问题,提供了一种医疗辅助决策模型的特征提取方法、电子装置及医疗案例相似度模型构建方法,能够提高医疗辅助决策模型的推荐结果准确率。
为了达到上述目的,本发明提供了一种医疗辅助决策模型的特征提取方法,含有以下步骤:
根据含有本体属性的医疗诊疗案例数据集构建样本训练集,样本总量为P,特征数量为N,设定近邻的样本数量为k;
通过构建的改进的ReliefF算法模型计算每个特征相应的权重,并根据每个特征权重的大小对特征进行排序;所述改进的ReliefF算法模型表示为:
式中,W(F)为特征F的权重,diff(F,R1,R2)为样本R1,R2在特征F上的距离差,Hj为第j个样本H,Mj(C)为类的第j个样本M,q为权重系数;其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛百洋智能科技股份有限公司,未经青岛百洋智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010182104.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种获得牛初始态诱导多能干细胞的方法
- 下一篇:一种模块化拼接的便携式安检门