[发明专利]一种基于大数据的疾病预测系统有效
申请号: | 202010112710.9 | 申请日: | 2020-02-24 |
公开(公告)号: | CN111161879B | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 王奔 | 申请(专利权)人: | 吾征智能技术(北京)有限公司 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/70;G06K9/62 |
代理公司: | 广州天河万研知识产权代理事务所(普通合伙) 44418 | 代理人: | 刘强;陈轩 |
地址: | 100089 北京市海淀区西三旗沁春*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 疾病 预测 系统 | ||
1.一种基于大数据的疾病预测系统,其特征是,包括数据获取模块、数据处理模块、疾病预测构建模块、疾病预测模块和信息显示模块,所述数据获取模块包括样本数据获取单元和人体数据采集单元,所述样本数据获取单元用于收集人体生理参数样本数据,所述人体数据采集单元用于采集患者的生理参数数据,所述数据处理模块包括第一数据处理单元和第二数据处理单元,所述第一数据处理单元用于对收集的人体生理参数样本数据进行处理,所述第一数据处理单元采用K均值聚类算法将收集的人体生理参数样本数据划分为L个样本子集,设收集的人体生理参数样本数据组成的样本集为X,且X={X1,X2,...,Xn},其中,n为样本数,Xi为样本集X中的第i个样本数据,设Ω(Xi,Ri)为样本数据Xi的有效局部邻域,其中,Ri表示样本数据Xi的有效局部邻域半径,Ω(Xi,Ri)为以样本数据Xi为球心,以Ri为半径的球形区域,采用迭代的方式确定样本数据Xi的有效局部邻域半径Ri的值:
设ri(t)表示第t次迭代时样本数据Xi的局部邻域半径,令ri(t)以步长1进行迭代增加,且样本数据Xi的初始邻域半径其中,Xj表示样本集X中的第j个数据,每一次迭代后,对样本数据Xi进行检测,定义样本数据Xi在局部邻域Ω(Xi,ri(t))中的邻域检测系数为P(ri(t)),且P(ri(t))的表达式为:
其中,Xg表示局部邻域Ω(Xi,ri(t))中的第g个样本数据,Xa和Xb分别表示样本集X中的第a和第b个样本数据,Ω(Xi,ri(t))表示以样本数据Xi为球心,以ri(t)为半径的球形区域,X(max)表示样本集X中的样本数据的最大值,表示局部邻域Ω(Xi,ri(t))中样本数据的平均值,M(Xi,ri(t))表示局部邻域Ω(Xi,ri(t))中的样本数据个数:
给定邻域检测阈值T(ri(t)),且其中,P(ri(j′))表示样本数据Xi在局部邻域Ω(Xi,ri(j′))中的邻域检测系数,ri(j′)表示第j′次迭代时样本数据Xi的局部邻域半径,Ω(Xi,ri(j′))表示以样本数据Xi为球心,以ri(j′)为半径的球形区域,P(ri(j′-1))表示样本数据Xi在局部邻域Ω(Xi,ri(j′-1))中的邻域检测系数,ri(j′-1)表示第(j′-1)次迭代时样本数据Xi的局部邻域半径,Ω(Xi,ri(j′-1))表示以样本数据Xi为球心,以ri(j′-1)为半径的球形区域;
当样本数据Xi在第t次迭代时的邻域检测系数P(ri(t))满足:时,令Ri=ri(t),其中,ri(t+1)表示第(t+1)次迭代时样本数据Xi的局部邻域半径,P(ri(t+1))表示样本数据Xi在局部邻域Ω(Xi,ri(t+1))中的邻域检测系数,Ω(Xi,ri(t+1))为以样本数据Xi为球心,以ri(t+1)为半径的球形区域;在样本集X中选取L个聚类中心,具体包括:
(1)选取样本数据的有效局部邻域中拥有样本数据个数最多的样本数据为第一个聚类中心l1;
(2)在样本集X的剩余的样本数据中选取剩余的(L-1)个聚类中心,定义样本数据Xi的信息值为Q(i),则Q(i)的表达式为:
式中,P(Ri)表示样本数据Xi在有效局部邻域Ω(Xi,Ri)中的邻域检测系数,P(Ri+1)表示样本数据Xi在局部邻域Ω(Xi,Ri+1)中的邻域检测系数,Ω(Xi,Ri+1)表示以样本数据Xi为球心,以(Ri+1)为半径的球形区域,M(Xi,Ri)表示有效局部邻域Ω(Xi,Ri)中样本数据的个数,Xs表示有效局部邻域Ω(Xi,Ri)中的第s个数据,lj″表示第j″个聚类中心,l表示当前已选取的聚类中心数,Rj″表示聚类中心lj″的有效局部邻域半径,Ω(lj″,Rj″)表示以聚类中心lj″为球心、以Rj″为半径的球形区域,Xk为有效局部区域Ω(lj″,Rj″)中的第k个数据,M(lj″,Rj″)表示有效局部邻域Ω(lj″,Rj″)中样本数据的个数;
计算样本集X中未选取为聚类中心的样本数据的信息值,选取信息值最大的样本数据为第二个聚类中心l2;
(3)重复步骤(2)中的选取方式,直到选取了L个聚类中心后停止;所述第二数据处理单元用于对采集的患者的生理参数数据进行处理,所述疾病预测构建模块采用处理后的人体生理参数样本数据对支持向量机进行训练,获得用于根据人体的生理参数数据进行疾病预测的支持向量机模型,所述疾病预测模块采用构建的支持向量机模型根据处理后的患者的生理参数数据进行疾病预测,所述信息显示模块用于显示疾病预测模块的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吾征智能技术(北京)有限公司,未经吾征智能技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010112710.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:便携式单冷空调
- 下一篇:板栗花提取物在制备食品或抗炎药物中的应用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置