[发明专利]用于治未病的医疗数据挖掘过程中均线趋势参数确定方法在审
申请号: | 201711307736.3 | 申请日: | 2017-12-11 |
公开(公告)号: | CN107910072A | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 张吕峥;高春蓉;方宝林;余小益;朱旭东 | 申请(专利权)人: | 创业软件股份有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙)33240 | 代理人: | 朱月芬 |
地址: | 310013 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 治未病 医疗 数据 挖掘 过程 中均线 趋势 参数 确定 方法 | ||
技术领域
本发明涉及一种用于治未病的医疗数据挖掘过程中均线趋势参 数确定方法。
背景技术
医疗大数据对海量的历史病例和健康人群的体征数据进行长期 跟踪、分析和处理,可以对体征数据的变化趋势进行学习,发现具有 较高患病风险的人群。对这些人群进行针对性的预防和早期检查措 施,可以有效降低发病率或者使发现时间提早。借用中医中治未病的 概念,本发明专利提出一种用于治未病的医疗数据挖掘方法。
目前普遍使用传统统计方法对于疾病进行检测,例如统计指标A 对疾病g的灵敏度和特异性。其中:
灵敏度=真阳性人数/(真阳性人数+假阴性人数)*100%
特异度=真阴性人数/(真阴性人数+假阳性人数)*100%
使用同样的方法也可以得到一些疾病的前驱症状,从而对疾病进 行提前发现,使病人可以尽早获得诊断和治疗。
现在一些互联网企业开始使用网络数据对流行性疾病进行预测, 例如百度和谷歌根据不同区域人群的搜索词频来判断流感的扩散趋 势:一个区域的人群如果在某一时间对感冒、发烧、板蓝根等词汇的 搜索频率提升时,通常会认为感冒的发病率提高,如果临近区域对同 一类词汇的搜索频率相继提升时,会认为可能出现流感。
但是在症状或者检验指标呈阳性时,往往疾病已经发生,互联网 手段也只能对群体性的疾病传播进行预测和控制,而对个体的疾病预 测并无帮助。
当前,随着便携式电子设备的迅猛发展和常规体检的普及,如何 对体征和检验大数据进行分析和挖掘,根据个体的体征及变化趋势, 在疾病发生之前进行预测,使得针对性的预防成为可能,极大的提高 人民的生活质量,并有效节省医疗资源。
发明内容
本发明的核心思想,是对每种疾病患者的历史体征数据进行分 析,获得患者从健康状态到患病之前的体征变化趋势模型,然后使用 该趋势模型对健康人群的体征数据进行跟踪,一旦发现符合趋势模型 的个体,就可以对他(她)进行预警。实现该趋势模型的关键点在于: 确定趋势模型中的长均线周期p和短均线周期q。
P和q值的设置直接影响了预警的灵敏度和特异性。如果设置的 p和q值过小,会使趋势模型变得过于灵敏,使特异性降低,而设置 的p和q值过小则会使趋势模型的灵敏度降低,发现的时间会推后甚 至晚于发病时间。因此使用人为静态设置的p和q值很难使模型处于 较好的状态。本发明在患者和健康个体组成的海量体征数据中挖掘得 到的p和q,在保证灵敏度和特异性两者之间进行平衡。
然而针对未发病的健康人群,希望在患病之前进行预警,因此不 能使用指标对疾病的灵敏度和特异性直接来代替预警的灵敏度和特 异性。为此本发明使用逆转率和迟报率来替代预警模型的灵敏度和特 异性,这也是本发明的创新之处。
本发明解决其技术问题所采用的技术方案如下:
本发明对每一个(p,q)对其中p>q计算:
计算逆转率f。
即在给定p,q参数的趋势模型下,出现趋势阳性信号,但在趋势 阳性信号开始的p个周期内,有任意一次测量值回落到该个体趋势阳 性信号出现前第p-1/2p个周期的均值以下的个体比例。逆转率越低, 信号的特异性越高。
计算迟报率v。
即在给定p,q参数的趋势模型下,出现趋势阳性信号的时间在发 病时间之后人占总发病人数的比例。迟报率越低,信号的灵敏度越高。
综合考虑逆转率和迟报率,使L=fv,选择具有最小L值得(p,q)对, 就是挖掘得到的趋势模型的推荐参数。
疾病g对应的体征指标A(具有较高灵敏度和特异性)的原始 数据如表1:
表1:原始数据表orig
其中id字段为被跟踪人员的编号,发病时间为该人员在发现 患病后估算得到的初始发病时间,length字段表示该人员总共测量体 征指标A的次数。每个record[]字段都记录一次测量体征指标A的结 果,每个record有测量时间time和测量得到的值value两个域。其 中time表示从格林威治时间1970年01月01日00时00分00秒起 至测量采样时为止的总秒数。
对原始数据的挖掘过程依次执行以下步骤:
参数变量定义:
orig:原始数据表;c_orig:时间序列体征数据表;
I:人员编号;Inter:时间间隔常数;
or=orig[i]:第i号人员的原始数据;cr=c_orig[i]:第i号人员的 时间序列体征数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创业软件股份有限公司,未经创业软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711307736.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置