[发明专利]癌症亚型关键基因筛选方法、系统、电子设备及存储介质在审
申请号: | 202310107640.1 | 申请日: | 2023-02-10 |
公开(公告)号: | CN116030894A | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 王淑栋;吴文浩;庞善臣;张媛媛;尹文静;赵亚武 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G16B40/00 | 分类号: | G16B40/00 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 万慧华 |
地址: | 266400 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 癌症 关键 基因 筛选 方法 系统 电子设备 存储 介质 | ||
本发明公开一种癌症亚型关键基因筛选方法、系统、电子设备及存储介质,涉及基因识别技术领域。该方法包括获取目标癌症亚型的癌症样本数据及对应正常样本数据;根据差异表达向量运算公式,计算癌症样本数据中各基因数据与正常样本数据中对应的基因数据之间的差异表达向量;根据差异表达向量,构建癌症样本数据中的各基因数据与目标癌症亚型之间的单基因相似性网络;基于单基因相似性网络,对癌症样本数据中各基因数据的特异性得分进行筛选,确定多个筛选基因;根据各筛选基因及对应的单基因相似性网络,构建基因‑基因相似性网络;根据基因‑基因相似性网络和RI/ARI指标确定关键基因。本发明能够提高得到的关键基因与癌症亚型之间的关联性。
技术领域
本发明涉及基因识别技术领域,特别是涉及一种癌症亚型关键基因筛选方法、系统、电子设备及存储介质。
背景技术
癌症是一种复杂的、高度异质性的疾病,由多种因素引起。传统的以癌细胞所在为基础的癌症分类方法对癌症类别的定义是模糊的,随着多组学数据在癌症亚型鉴定中的应用,研究人员有机会从分子的角度更直观地了解癌症亚型,利用多组学数据可以更有效地识别癌症亚型。
随着高通量技术的发展,大量的多组学数据已被广泛用于癌症亚型鉴定研究。例如,Chen等人将基因表达数据和基因相互作用网络结合起来,通过网络中的边缘干扰来识别乳腺癌亚型。Gao等人使用去噪自动编码器融合多组学数据进行卵巢癌亚型鉴定。Wu等人提出了一种结合多组学数据和相似性网络融合(SNF)的方法来识别心衰的亚型。Tang等人提出了一种基于统计矩的方法,以减少高通量蛋白质全息数据的维度来识别癌症亚型。Liu等人提出了一种基于张量分解的癌症亚型识别方法(ProTICS),通过张量分解对融合的多组学数据进行分解,实现癌症亚型识别。Wasito等采用核分类和SVM相结合的方法降低了患者基因表达数据的维度,实现了淋巴瘤的亚型识别。Zhang等人提出了一种基于单样本信息增益(SSIG)的癌症亚型识别方法,通过考虑样本的异质性来融合多组学数据,识别乳腺癌(BRCA)和肾透明细胞癌(KIRC)。虽然上述基于多组学数据的亚型鉴定方法取得了一些成绩,但由于多组学数据的高维度和高噪声的特点,上述方法都是在降低数据的整体维度的同时,忽略了单个基因对亚型的贡献。
事实上,只有少数重要的基因与癌症亚型的具体识别有关,因此挖掘用于癌症亚型鉴定的分子标记物,能够有效地识别癌症亚型。因此,人们在识别癌症亚型鉴定的分子标志物方面做了更多的努力。Ali等采用邻接成分分析法,筛选出miRNA作为识别肾癌亚型的关键因素16。Liu等人利用GeneRank评分与深度神经网络(DNN)相结合产生的基因重要性评分,去除多余的基因,来识别三阴性乳腺癌亚型。Yuan等人使用蒙特卡洛特征选择(MCFS)和SVM的组合来识别肺癌亚型。Yu等人将基因调控网络与差异表达分析相结合,得到加权的差异表达基因,并通过得到的基因识别乳腺浸润性癌的亚型。虽然上述方法充分考虑了每个基因对癌症亚型鉴定的贡献,有些也利用了生物网络信息,但都是利用已知的生物网络,没有考虑利用异质基因构建的网络,由此获得的基因不能很好的表征基因与癌症亚型之间的关系。
发明内容
本发明的目的是提供一种癌症亚型关键基因筛选方法、系统、电子设备及存储介质,能够提高得到的关键基因与癌症亚型之间的关联性。
为实现上述目的,本发明提供了如下方案:
一种癌症亚型关键基因筛选方法,包括:
获取目标癌症亚型的癌症样本数据及对应的正常样本数据;所述癌症样本数据及对应的正常样本数据均包括多个基因数据;
根据差异表达向量运算公式,计算所述癌症样本数据中的各基因数据与正常样本数据中对应的基因数据之间的差异表达向量;
根据所述差异表达向量,构建所述癌症样本数据中的各基因数据与目标癌症亚型之间的单基因相似性网络;
基于所述单基因相似性网络,对所述癌症样本数据中各基因数据的特异性得分进行筛选,确定多个筛选基因;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310107640.1/2.html,转载请声明来源钻瓜专利网。