[发明专利]一种基于测序和数据分析的肥胖风险预测装置的预测方法有效
申请号: | 202010810113.3 | 申请日: | 2020-08-13 |
公开(公告)号: | CN112086130B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 李健;杨广霞;许瑶坤;况迎辉;刘安娜 | 申请(专利权)人: | 东南大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16H50/30;G16H50/70;G06K9/62;G06N3/04 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 梁耀文 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 分析 肥胖 风险 预测 装置 方法 | ||
本发明公开了一种基于测序和数据分析的肥胖风险预测装置及其预测方法,包括以下步骤:对原始SNP样本数据的处理;创建初步模型,包括对肥胖进行分类和对身高体重进行回归性分析;创建位点评分模型,所述位点评分模型包括Logistic Regression模型、SVM模型、Decision Tree模型和Random Forest模型;利用数据库的数据对模型进行优化;对优化模型进行分析;引入集成学习的肥胖预测模型。本发明通过将机器学习和基因分析相结合,利用庞大的基因型与对应个体的生理信息数据库,实现对个体肥胖风险的预测以及生理信息异常风险进行评估。
技术领域
本发明属于基因测序技术领域,特别涉及一种基于测序和数据分析的肥胖风险预测装置的预测方法。
背景技术
现有肥胖评估模型(体重指数、腰围臀围比)只将少数身体指标纳入评价体系,具有很大的缺陷。在小样本研究或个体应用中,由于BMI指数没有考虑到身体成分构成和肥胖的影响因素,其准确性必然存在问题。此外,BMI指数模型忽略了男女身体的差异,男女本身身体的差异在此模型中被忽视,就会导致因为性别问题而在肥胖预测中产生误判。这种类型的误判在女性尤其常见。根据有关研究显示,腰围腰臀比存在明显的性别差异,腰围和腰臀比皆按不同的性别采用不同的切点,两者用于评估人群肥胖发生率时差异较小。所以将腰围臀围比作为肥胖评估指标的准确度较低,会有一大批人群错过肥胖或代谢综合征的早期诊断和治疗。
发明内容
发明目的:针对上述问题,本发明提供一种基于测序和数据分析的肥胖风险预测装置的预测方法,通过将机器学习和基因分析相结合,利用庞大的基因型与对应个体的生理信息数据库,实现对个体肥胖风险的预测以及生理信息异常风险进行评估。
技术方案:本发明提出一种基于测序和数据分析的肥胖风险预测装置,包括数据处理单元、数据可视化单元、肥胖分类单元、基因位点预测单元和位点评分单元;
数据处理单元,用于对原始SNP样本数据进行处理;
数据可视化单元,用于对所有数据进行可视化处理,得到样本的身高、体重、腰围及BMI指数之间的关系;
肥胖分类单元,通过K-MEANS算法对肥胖进行分类,确定不同基因对不同肥胖类型的影响;
基因位点预测单元,通过浅层神经网络对基因位点信息、性别信息及身高体重进行回归性分析,预测基因位点对身高体重影响程度;
位点评分单元,基于集成学习模型,利用SNPs的信息和个体的生理信息对肥胖风险进行评估。
一种如上所述的基于测序和数据分析的肥胖风险预测装置的预测方法,其特征在于,包括如下步骤:
(1)对原始SNP样本数据进行处理;
(2)创建初步模型,包括对肥胖进行分类和对身高体重进行回归性分析;
(3)创建位点评分模型,所述位点评分模型包括Logistic Regression模型、SVM模型、Decision Tree模型和Random Forest模型;在机器学习任务中,将原始数据集分为三部分:训练集、验证集和测试集;
(4)利用数据库的数据对模型进行优化;
(5)对优化模型进行分析;
(6)引入集成学习的肥胖预测模型。
进一步的,所述步骤(1)中对原始SNP样本数据进行处理的具体步骤如下:
(1.1)将所有SNP信息文件转化为csv文件;
(1.2)进行数据清洗,去除不相关的位点信息数据和极端数据;
(1.3)将所有数据进行可视化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010810113.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置