[发明专利]一种消化道疾病数据加密获取方法及风险预测系统有效
申请号: | 202010688366.8 | 申请日: | 2020-07-16 |
公开(公告)号: | CN111814169B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 薛付忠;季晓康;丁荔洁;王永超;杨帆;袁同慧;高超男;刘廷轩;王睿;王京彦;刘真;马官慧;杨伟浩;韩君铭 | 申请(专利权)人: | 山东大学;阳光保险集团股份有限公司;康评医疗健康有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06F21/64;G06Q40/08;G16H50/70 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
地址: | 250002 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 消化道 疾病 数据 加密 获取 方法 风险 预测 系统 | ||
1.一种消化道疾病数据加密获取方法,其特征在于,包括:
对疾病大数据队列进行标准化,具体为,从疾病大数据队列中筛选样本数据集,将样本数据中的疾病名称与疾病分类标准中的疾病名称进行对照,将样本数据中的疾病名称进行标准化,包括名称相同对照、名称相似对照和包含对照;对于疾病大数据队列中未标准化的数据,将疾病名称与样本数据中的原疾病名称进行对照,完成部分疾病名称的标准化;对于疾病大数据队列中剩余未标准化的数据,将疾病编码与疾病分类标准中的编码进行对照,对于编码对照成功的数据,将疾病分类标准中的编码相应的疾病名称写入标准化字段;
根据消化道疾病相关疾病名称,从疾病大数据队列中匹配身份证号、姓名、性别以及地域数据,得到消化道疾病队列;
在所述消化道疾病队列中,对身份证号、姓名、性别以及地域数据进行脱敏加密,并设置数据调取权限;
根据消化道疾病队列访问请求,验证用户权限是否在数据调取权限范围内,若在,则通过用户ID验证调取密码,通过认证后,获取访问消化道疾病队列的权限,并获取消化道疾病病例,在消化道疾病病例中获取消化道疾病相关疾病变量;
否则,无权访问所述消化道疾病队列;
将消化道疾病相关疾病变量与患消化道疾病事件进行相关性分析,筛选得到危险因素,基于筛选的危险因素构建消化道疾病风险预测模型,根据接收发病风险预测获取消化道疾病发病概率预测结果;
将消化道疾病相关疾病变量与患消化道疾病事件进行相关性分析,筛选得到危险因素,具体为:
将各消化道疾病相关疾病变量与消化道疾病结局事件进行相关性分析,将相关性大于设定阈值的危险因素作为候选危险因素;根据是否具有危险因素,构建二值化危险因素矩阵X,其中,每一行对应一个人,每一列对应一类危险因素,矩阵X的第m行第n列X(m,n)表示第m个人是否具有第n类危险因素,若是,记为1,若否,记为0;根据是否发生消化道疾病结局事件,构建二值化消化道疾病矩阵Y,其中,矩阵Y包含一列,每一行对应一个人是否发生消化道疾病结局事件;将二值化危险因素矩阵X的每一列与矩阵Y进行相关性分析,得到相关性矩阵R,矩阵R中的各元素表示各危险因素与消化道疾病的相关性,将相关性大于设定阈值的危险因素作为候选危险因素;
基于贝叶斯网络,从候选危险因素中筛选最终危险因素;
构建消化道疾病风险预测模型,具体为:
基于筛选的危险因素采用logistic回归模型进行单因素分析,通过逐步筛选法选择食管癌的独立预测因子;logistic回归模型的公式如下:
其中β0为常数项,β1,β2,…,βp为回归系数,X1,X2,…,Xp为自变量,P为预测值;
将危险因素进行多因素logistic回归分析,建立食管癌疾病预测模型;
对模型进行多次构建,每次多引入一个新的危险指标,通过净重新分类指数衡量模型的预测性能,得到预测性能最好的最终预测模型;首先基于每个危险因素分别进行单因素建模,得到预测性能最好的初始预测模型,相应的危险因素即为最重要因素;然后,在该初始预测模型的基础上,引入其他危险因素中的一个,进行两因素建模,得到预测性能最好的两因素预测模型,新引入的危险因素即为次重要因素;依次类推,依次引入新的危险指标,直至预测模型的性能不再增强。
2.如权利要求1所述的一种消化道疾病数据加密获取方法,其特征在于,
所述疾病大数据队列,根据预设的与疾病有关的字段,查找数据库系统中包含这些字段的数据表;基于查找到的数据表,抽取身份证号和疾病相关的字段,生成疾病大数据队列。
3.如权利要求1所述的一种消化道疾病数据加密获取方法,其特征在于,
所述名称相同对照为获取疾病名称与疾病分类标准中的疾病名称完全一致的样本数据,将原疾病名称写入标准化名称字段;
所述名称相似对照为获取疾病名称与疾病分类标准中的疾病名称相似度超过设定阈值的样本数据,将原疾病名称写入标准化名称字段;
所述包含对照为获取疾病名称与疾病分类标准中的疾病名称存在包含关系的样本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学;阳光保险集团股份有限公司;康评医疗健康有限公司,未经山东大学;阳光保险集团股份有限公司;康评医疗健康有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010688366.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置