[发明专利]一种癌症相关SNP、基因、miRNA和蛋白质相互作用的多层网络模型构建方法和应用有效
申请号: | 201811087575.6 | 申请日: | 2018-09-18 |
公开(公告)号: | CN109326316B | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 张阳;赵毅;王德华 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G16B5/00 | 分类号: | G16B5/00 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 刘奇 |
地址: | 518000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 癌症 相关 snp 基因 mirna 蛋白质 相互作用 多层 网络 模型 构建 方法 应用 | ||
1.一种癌症相关SNP、基因、miRNA和蛋白质相互作用的多层网络模型构建方法,包括以下步骤:
1)将癌症组织样本与正常组织样本的全基因组数据进行全基因组关联分析获得SNP位点数据,并从SNP位点数据中筛选差异显著的SNP位点数据;
2)用xgboost法分别分析癌症组织样本与正常组织样本的基因表达数据、miRNA数据和蛋白质数据获得差异显著的基因表达数据、miRNA数据和蛋白质数据;
3)以步骤2)获得的差异显著的基因表达数据、miRNA数据和蛋白质数据分别为一层,用最大信息系数法分别分析各层层内数据的关联关系以及任意两层间数据的关联关系;
4)以步骤1)中获得的差异显著的SNP位点数据为一层,将所述差异显著的SNP位点数据与步骤3)中的差异显著的基因表达数据层进行关联获得SNP位点与基因表达数据层之间的关联关系;从而获得由SNP位点-基因-miRNA-蛋白质之间的多层网络关联关系;
步骤3)中所述关联关系的确定为计算关联系数,若关联系数MIC≥0.5则确定关联关系;
步骤4)中所述差异显著的SNP位点数据与步骤3)中差异显著的基因表达数据层关联关系的确定为当所述差异显著的SNP位点位于差异显著的基因内部时,确定关联关系;
步骤1)与步骤2)之间无时间顺序限定。
2.根据权利要求1所述的多层网络模型构建方法,其特征在于,所述癌症组织样本与正常组织样本的全基因组数据为经过主成分分析筛选的基因背景相同的全基因组数据。
3.根据权利要求2所述的多层网络模型构建方法,其特征在于,步骤1)中所述筛选差异显著的SNP位点数据方法为χ2检验、Fisher检验分析法、逻辑回归法和xgboost算法中的一种。
4.根据权利要求1所述的多层网络模型构建方法,其特征在于,步骤3)中当所述关联系数MIC≥0.6时,确定关联关系。
5.根据权利要求1所述的多层网络模型构建方法,其特征在于,步骤2)中所述差异显著的基因表达数据、miRNA数据和蛋白质数据独立地为xgboost法计算重要度排序前2~8的数据。
6.根据权利要求1所述的多层网络模型构建方法,其特征在于,所述癌症包括乳腺癌。
7.权利要求1~6任意一项所述多层网络模型构建方法获得的多层网络模型在筛选肿瘤标志物中的应用。
8.权利要求7所述的应用,其特征在于,选择权利要求1~6任意一项所述方法获得的多层网络模型中,能够自SNP位点-基因-miRNA-蛋白质构成一条连通的通路中的SNP位点、基因、miRNA或蛋白质作为肿瘤标志物。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811087575.6/1.html,转载请声明来源钻瓜专利网。