[发明专利]一种代谢组学数据融合优化处理方法有效
申请号: | 201710227598.1 | 申请日: | 2017-04-10 |
公开(公告)号: | CN107133448B | 公开(公告)日: | 2020-05-01 |
发明(设计)人: | 郑宏;高红昌 | 申请(专利权)人: | 温州医科大学 |
主分类号: | G16H50/50 | 分类号: | G16H50/50;G16C20/10;G16C20/70 |
代理公司: | 温州金瓯专利事务所(普通合伙) 33237 | 代理人: | 林岩龙 |
地址: | 325000 浙江省温州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 代谢 数据 融合 优化 处理 方法 | ||
本发明公开了一种代谢组学数据融合优化处理方法,包括以下步骤:1)将关于多个病人的不同来源的代谢组学数据分别转换成代谢数据矩阵;2)利用实验设计方法分别优化不同来源的代谢组学数据最佳前处理方法,通过优化后的数据最佳前处理方法处理步骤1)中的代谢数据矩阵,结合分类模型找出贡献较大的代谢物数据;3)将步骤2)找出贡献较大的代谢物数据转换成重要代谢数据矩阵;4)利用实验设计方法优化重要代谢数据矩阵的数据最佳前处理方法,通过优化后的数据最佳前处理方法处理步骤3)中的重要代谢数据矩阵,结合分类模型对不同的病人进行分型和分类。本发明提高对疾病的分型和分类准确性,能够辅助医生更加精准地为病人制定个性化治疗方案。
技术领域
本申请涉及医学数据信息挖掘领域,更具体地涉及一种代谢组学数据融合优化处理方法。
背景技术
随着精准医学时代的到来,疾病的准确分类对于制定个性化和精准化的治疗方案极为重要。代谢组学是继基因组学和蛋白组学后的一种相对较新的组学技术,该技术目的在于尽可能多得检测生物样品中的小分子代谢物,从而反映生物体在不同环境下(比如疾病发生发展过程、药物/饮食干预等)的代谢变化情况。代谢组学技术可以在代谢物层面反映生物体个性化的差异,因此,该技术可以实现临床疾病的分型和分类。
代谢组学可以产生大量的数据信息,而且这些数据可以来源于不同的生物样品,还可以来源于不同的分析平台,但是我们不可忽视任何来源的数据,因为其中包含我们所需要病人信息。数据融合技术可以将不同来源的数据进行整合,从而实现更加准确的疾病分型和分类。
不同来源的数据具有不同的特征,因此,在选择数据前处理方法上也不可一概而论。但是,目前存在许多不同的数据前处理方法,如何根据不同数据特征选择最佳的数据前处理方法是数据分析领域的一个热点问题。另外,数据融合并不是简单地将数据叠加一起,融合不同来源数据中重要信息将减少数据量,提高数据处理速度,但是,如何从不同来源的数据中选择重要信息也是数据分析领域的一个备受关注的问题。
发明内容
为解决当前存在的上述问题,本申请提出了一种代谢组学数据融合优化处理方法
本发明所采取的技术方案如下:一种代谢组学数据融合优化处理方法,包括以下步骤:
1)将关于多个病人的不同来源的代谢组学数据分别转换成多个代谢数据矩阵;
2)利用实验设计方法分别优化不同来源的代谢组学的数据最佳前处理方法,通过优化后的数据最佳前处理方法对应处理步骤1)中的代谢数据矩阵,结合分类模型找出贡献较大的代谢物数据;
3)将步骤2)找出贡献较大的代谢物数据融合转换成重要代谢数据矩阵;
4)利用实验设计方法优化重要代谢数据矩阵的数据最佳前处理方法,通过优化后的数据最佳前处理方法处理步骤3)中的重要代谢数据矩阵,结合分类模型对不同的病人进行分型和分类。
优选地,步骤1)中代谢组学数据的来源为血液、尿液、粪便、汗液、心脏组织、肾脏组织、肝脏组织、胃肠道组织中的一种或多种,所述代谢组学数据通过核磁共振波谱仪、液质联用仪、气质联用仪、红外光谱仪、紫外光谱仪、拉曼光谱仪中的一种或多种得到。
优选地,步骤2)中具体包括以下步骤:
步骤2-1.通过实验设计方法选择不同数据前处理方法的组合方式;
步骤2-2.分别对步骤1)得到的代谢数据矩阵按步骤2-1中的组合方式进行数据前处理;
步骤2-3.将数据前处理后得到的数据输入分类模型,通过实验设计方法建立分类模型性能参数和不同数据前处理方法之间的关系,评价分类模型性能,分析不同前处理对分类模型性能参数的影响;
步骤2-4.通过实验设计方法最大化分类模型性能参数,选择最佳数据前处理方法组合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州医科大学,未经温州医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710227598.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置