[发明专利]一种基于高通量测序数据和临床表型构建复杂疾病状态评估方法及应用在审
申请号: | 202010469452.X | 申请日: | 2020-05-28 |
公开(公告)号: | CN111863137A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 李园园;戴文韬;刘伟 | 申请(专利权)人: | 上海朴岱生物科技合伙企业(有限合伙) |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G16H50/20 |
代理公司: | 上海德禾翰通律师事务所 31319 | 代理人: | 陈艳娟 |
地址: | 200442 上海市宝*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通量 序数 临床 表型 构建 复杂 疾病 状态 评估 方法 应用 | ||
1.一种基于转录组数据、外显子组数据和临床表型挖掘复杂疾病标志物的方法,其特征在于,包括以下步骤:
步骤1)对复杂疾病病例信息进行分类整理:
步骤1.1)将所述复杂疾病病例信息分为转录组数据、外显子组/基因组数据和临床信息;
步骤1.2)将所述复杂疾病病例信息按照疾病状态分类并进行配对整理;
步骤2)构建复杂疾病标志物组合,使用基于贪婪算法的逐次迭代和/或基于遗传算法的进化迭代进行组合优化筛选:
若所述复杂疾病病例信息仅涉及转录组数据与临床信息,则执行步骤2.1)基于转录组数据与临床信息进行标志物挖掘,构建复杂疾病相关的基因异常调控关系标志物组合;
若所述复杂疾病病例信息仅涉及外显子组/基因组数据与临床信息,则执行步骤2.2)基于外显子组/基因组数据与临床信息进行标志物挖掘,构建复杂疾病相关的基因变异标志物组合;
若所述复杂疾病病例信息同时包含转录组数据、外显子组/基因组数据与临床信息,则执行步骤2.3)基于转录组数据、外显子组/基因组数据与临床信息进行标志物挖掘,构建复杂疾病相关的基因异常调控关系和基因变异标志物组合。
2.如权利要求1所述的方法,其特征在于,所述步骤2.1)具体包括以下子步骤:
步骤2.1.1)构建参考基因调控网络;
步骤2.1.2)基于特定疾病状态下的转录组数据以及所述参考基因调控网络的TF-target关系,构建条件特异的基因调控网络;
步骤2.1.3)量化条件特异的基因调控网络中的基因调控强度和网络间调控强度差异;
步骤2.1.4)筛选不同疾病状态下的条件特异的基因调控网络之间的基因异常调控关系;
步骤2.1.5)基于步骤2.1.4)得到的基因异常调控关系,构建复杂疾病相关的基因异常调控关系标志物组合。
3.如权利要求2所述的方法,其特征在于,步骤2.1.2)中,采用基于机器学习的特征选择算法,包括Boruta、Bayes、NMF、单变量线性回归,并通过异构计算或并行化方法实现加速,筛选在疾病状态下对TF-target关系贡献显著的TFs,形成条件特异的基因调控网络,即特定疾病状态的基因调控网络;和/或,
步骤2.1.3)中,采用多元线性回归模型量化条件特异的基因调控网络中的基因调控强度;
采用De-biased LASSO方法进行回归,求解得到每一个基因调控关系的调控强度及其置信区间,通过比较不同条件特异的基因调控网络中同一调控关系的置信区间是否有重叠,判定其调控差异是否显著;或通过比较不同条件特异的基因调控网络中同一调控关系的强度均值变化,无需计算置信区间,直接量化其调控差异;和/或,
步骤2.1.4)中,整合三方面与基因调控相关的因素,筛选不同疾病状态下的条件特异的基因调控网络之间的基因异常调控关系,包括:基因调控强度显著变化、调控目标基因表达水平显著变化,以及TF对target的调控强度变化方向与target表达水平变化方向一致;同时,根据调控强度在不同疾病状态间的差异程度,对筛选到的基因异常调控关系进行排序;和/或,
步骤2.1.5)中以基于贪婪算法的逐次增加迭代,和/或基于遗传算法的进化迭代,构建复杂疾病相关的基因异常调控关系标志物组合;对上述标志物组合,以C-index为指标衡量其对疾病预后状态的预测效果,或以AUC为指标衡量其对治疗方案受益状态的预测效果。
4.如权利要求1所述的方法,其特征在于,所述步骤2.2)具体包括以下子步骤:
步骤2.2.1)识别与复杂疾病相关的基因变异;
步骤2.2.2)采用数据驱动和/或先验知识驱动定量筛选复杂疾病状态相关的重要基因变异;
步骤2.2.3)基于步骤2.2.2)得到的复杂疾病状态相关的重要基因变异,构建复杂疾病相关的基因变异标志物组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海朴岱生物科技合伙企业(有限合伙),未经上海朴岱生物科技合伙企业(有限合伙)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010469452.X/1.html,转载请声明来源钻瓜专利网。