[发明专利]用于治未病的医疗数据挖掘过程中均线趋势参数确定方法在审

专利信息
申请号: 201711307736.3 申请日: 2017-12-11
公开(公告)号: CN107910072A 公开(公告)日: 2018-04-13
发明(设计)人: 张吕峥;高春蓉;方宝林;余小益;朱旭东 申请(专利权)人: 创业软件股份有限公司
主分类号: G16H50/70 分类号: G16H50/70
代理公司: 杭州君度专利代理事务所(特殊普通合伙)33240 代理人: 朱月芬
地址: 310013 浙江省杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 治未病 医疗 数据 挖掘 过程 中均线 趋势 参数 确定 方法
【说明书】:

技术领域

本发明涉及一种用于治未病的医疗数据挖掘过程中均线趋势参 数确定方法。

背景技术

医疗大数据对海量的历史病例和健康人群的体征数据进行长期 跟踪、分析和处理,可以对体征数据的变化趋势进行学习,发现具有 较高患病风险的人群。对这些人群进行针对性的预防和早期检查措 施,可以有效降低发病率或者使发现时间提早。借用中医中治未病的 概念,本发明专利提出一种用于治未病的医疗数据挖掘方法。

目前普遍使用传统统计方法对于疾病进行检测,例如统计指标A 对疾病g的灵敏度和特异性。其中:

灵敏度=真阳性人数/(真阳性人数+假阴性人数)*100%

特异度=真阴性人数/(真阴性人数+假阳性人数)*100%

使用同样的方法也可以得到一些疾病的前驱症状,从而对疾病进 行提前发现,使病人可以尽早获得诊断和治疗。

现在一些互联网企业开始使用网络数据对流行性疾病进行预测, 例如百度和谷歌根据不同区域人群的搜索词频来判断流感的扩散趋 势:一个区域的人群如果在某一时间对感冒、发烧、板蓝根等词汇的 搜索频率提升时,通常会认为感冒的发病率提高,如果临近区域对同 一类词汇的搜索频率相继提升时,会认为可能出现流感。

但是在症状或者检验指标呈阳性时,往往疾病已经发生,互联网 手段也只能对群体性的疾病传播进行预测和控制,而对个体的疾病预 测并无帮助。

当前,随着便携式电子设备的迅猛发展和常规体检的普及,如何 对体征和检验大数据进行分析和挖掘,根据个体的体征及变化趋势, 在疾病发生之前进行预测,使得针对性的预防成为可能,极大的提高 人民的生活质量,并有效节省医疗资源。

发明内容

本发明的核心思想,是对每种疾病患者的历史体征数据进行分 析,获得患者从健康状态到患病之前的体征变化趋势模型,然后使用 该趋势模型对健康人群的体征数据进行跟踪,一旦发现符合趋势模型 的个体,就可以对他(她)进行预警。实现该趋势模型的关键点在于: 确定趋势模型中的长均线周期p和短均线周期q。

P和q值的设置直接影响了预警的灵敏度和特异性。如果设置的 p和q值过小,会使趋势模型变得过于灵敏,使特异性降低,而设置 的p和q值过小则会使趋势模型的灵敏度降低,发现的时间会推后甚 至晚于发病时间。因此使用人为静态设置的p和q值很难使模型处于 较好的状态。本发明在患者和健康个体组成的海量体征数据中挖掘得 到的p和q,在保证灵敏度和特异性两者之间进行平衡。

然而针对未发病的健康人群,希望在患病之前进行预警,因此不 能使用指标对疾病的灵敏度和特异性直接来代替预警的灵敏度和特 异性。为此本发明使用逆转率和迟报率来替代预警模型的灵敏度和特 异性,这也是本发明的创新之处。

本发明解决其技术问题所采用的技术方案如下:

本发明对每一个(p,q)对其中p>q计算:

计算逆转率f。

即在给定p,q参数的趋势模型下,出现趋势阳性信号,但在趋势 阳性信号开始的p个周期内,有任意一次测量值回落到该个体趋势阳 性信号出现前第p-1/2p个周期的均值以下的个体比例。逆转率越低, 信号的特异性越高。

计算迟报率v。

即在给定p,q参数的趋势模型下,出现趋势阳性信号的时间在发 病时间之后人占总发病人数的比例。迟报率越低,信号的灵敏度越高。

综合考虑逆转率和迟报率,使L=fv,选择具有最小L值得(p,q)对, 就是挖掘得到的趋势模型的推荐参数。

疾病g对应的体征指标A(具有较高灵敏度和特异性)的原始 数据如表1:

表1:原始数据表orig

其中id字段为被跟踪人员的编号,发病时间为该人员在发现 患病后估算得到的初始发病时间,length字段表示该人员总共测量体 征指标A的次数。每个record[]字段都记录一次测量体征指标A的结 果,每个record有测量时间time和测量得到的值value两个域。其 中time表示从格林威治时间1970年01月01日00时00分00秒起 至测量采样时为止的总秒数。

对原始数据的挖掘过程依次执行以下步骤:

参数变量定义:

orig:原始数据表;c_orig:时间序列体征数据表;

I:人员编号;Inter:时间间隔常数;

or=orig[i]:第i号人员的原始数据;cr=c_orig[i]:第i号人员的 时间序列体征数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创业软件股份有限公司,未经创业软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711307736.3/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top