[发明专利]基于知识驱动和数据驱动的分群方法及相关设备有效
申请号: | 201910991392.5 | 申请日: | 2019-10-18 |
公开(公告)号: | CN110929752B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 廖希洋;孙行智;赵婷婷;田静涛;赵丽君 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06N5/02;G16H50/70 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 谢文强 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 驱动 数据 分群 方法 相关 设备 | ||
1.一种基于知识驱动和数据驱动的分群方法,其特征在于,所述方法包括:
根据医学规则数据创建初始知识分群决策树,并将样本数据填充至所述初始知识分群决策树各分支的末端知识子节点,得到目标知识分群决策树,所述医学规则数据用于指示对已归档的医学文献、医学共识、医学指南和专家的临床经验的医学学科知识数据进行规则提取处理所得的第一分群规则,所述第一分群规则用于对临床上的相似特征人群进行分群,所述样本数据包括遵循医学知识规则的临床上的相似特征人群对应的临床结局数据;
获取待分类人群的特征数据,并通过所述目标知识分群决策树对所述特征数据进行分群,得到目标末端知识子节点对应的处理方案,并对所述处理方案的类别数量进行识别,所述目标末端知识子节点为所述特征数据在所述目标知识分群决策树上的节点位置,所述处理方案用于指示对相似特征人群的解决渠道;
若识别到所述处理方案的类别数量为一个,则确定所述待分类人群属于第一特征相似人群,所述第一特征相似人群为所述目标知识分群决策树中目标末端知识子节点对应的处理方案所属的特征相似人群;
若识别到所述处理方案的类别数量为至少两个,则基于第二分群规则生成数据分群决策树,并确定每个处理方案对应所述数据分群决策树的数据子节点所处的目标层数,所述第二分群规则指示根据递归分区算法和处理方案的有效性进行分类;
若所述目标层数为第一层,则将所述待分类人群划分为所述第一特征相似人群;
若所述目标层数不为第一层,则将所述待分类人群划分为第二特征相似人群,所述第二特征相似人群为所述数据分群决策树中目标数据节点对应的处理方案所属的特征相似人群,每个目标数据节点对应不同的特征相似人群;
所述基于第二分群规则生成数据分群决策树,并确定每个处理方案对应所述数据分群决策树的数据子节点所处的目标层数,包括:
步骤一:将所述目标末端知识子节点作为所述数据分群决策树的数据根节点,计算所述数据根节点对应的样本数据中处理方案的有效性分值;
步骤二:根据每个处理方案的有效性分值对所述数据根节点进行分支,根据递归分区算法将每个处理方案依次划分到每个分支的数据子节点中,并继续对每个数据子节点对应的处理方案进行有效性分析;
步骤三:若当前数据子节点所对应的处理方案的有效性分值大于第一阈值,则对所述当前数据子节点进行分支;
步骤四:重复执行步骤三,直至每个数据子节点所对应的处理方案的有效性分值小于或等于所述第一阈值,得到数据分群决策树,所述数据分群决策树包括多个数据子节点,所述多个数据子节点中每个末端数据叶子节点对应有一个处理方案;
步骤五:确定每个处理方案对应的末端数据叶子节点在所述数据分群决策树中所处的目标层数;
所述将所述目标末端知识子节点作为所述数据分群决策树的数据根节点,计算所述数据根节点对应的处理方案的有效性分值,包括:
将所述目标末端知识子节点作为所述数据分群决策树的数据根节点;
获取所述数据根节点对应的样本数据中处理方案的目标特征信息,将所述目标特征信息拆分成因素因子;
计算所述因素因子在不同水平上的关联度、对预置影响因素的影响度以及所述因素因子不控制的边缘关联度;
通过预置的可压缩准则和可比较准则分析所述关联度、所述影响度和所述边缘关联度,得到混杂因子;
计算所述混杂因子与所述预置影响因素发生概率的回归系数的指数变换值,并以所述指数变换值作为判定得分,得到所述数据根节点对应的处理方案的有效性分值,所述指数变换值的计算公式如下:
所述p(y=kx;w)为所述指数变换值,所述w为所述混杂因子与所述预置影响因素发生的概率,所述x为所述混杂因子,所述k为所述预置影响因素的类别数量,所述y为输出的预测值,所述y是k的条件概率,所述K为k的最大值,所述T为时间周期。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910991392.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置