[发明专利]基于基因突变与基因表达的药物重定位方法有效
申请号: | 201710429774.X | 申请日: | 2017-06-09 |
公开(公告)号: | CN107292130B | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 鱼亮;许凤丹 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B20/20;G16B25/00 |
代理公司: | 61205 陕西电子工业专利中心 | 代理人: | 韦全生;王品华<国际申请>=<国际公布> |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于基因突变与基因表达的药物重定位方法,用于解决现有技术中存在的定位结果准确率低的技术问题。实现步骤为:处理SNP突变数据,得到所有基因的突变频率数据;对基因表达数据进行处理得到标准化基因表达矩阵数据,并计算各基因表达变化值及其统计显著值;对SNP突变数据中所有基因的突变频率数据和标准化基因表达矩阵数据中的基因进行二次分类;获取疾病和各药物的相关性值;计算疾病和各药物的相关性值的绝对值,并按照这些绝对值由大到小的规则,对所有药物进行排序,得到所有药物的排名;获取对疾病具有潜在治疗效果的候选药物。本发明可用于预测对癌症具有潜在治疗效果的候选药物。 | ||
搜索关键词: | 基于 基因突变 基因 表达 药物 定位 方法 | ||
【主权项】:
1.一种基于基因突变与基因表达的药物重定位方法,包括如下步骤:/n(1)处理SNP突变数据:统计SNP突变数据中每个基因在所有疾病状态样本中的突变频率,得到所有基因的突变频率数据;/n(2)处理基因表达数据,并计算各基因表达变化值及其统计显著值:/n(2a)获取癌症病人样本集合和正常人样本集合:利用TCGA提供的Barcode编码,对TCGA中基因表达数据的样本种类进行识别,得到癌症病人样本集合和正常人样本集合;/n(2b)对癌症病人样本集合与正常人样本集合进行合并,得到基因表达矩阵数据;/n(2c)采用标准分数,对基因表达矩阵数据中的每个基因的表达值进行标准化处理,得到标准化基因表达矩阵数据;/n(2d)对标准化基因表达矩阵数据进行基因差异表达对照分析,得到标准化基因表达矩阵数据中各基因表达变化值logFCi和各基因表达变化值logFCi的统计显著值P.valuei,其中,i表示标准化基因表达矩阵数据中的基因序号;/n(3)对SNP突变数据中所有基因的突变频率数据和标准化基因表达矩阵数据中的基因进行二次分类:/n(3a)设置所有基因的突变频率数据中频繁突变频率的阈值为Mine-MF,各基因表达变化值logFCi差异变化的阈值为δ,基因表达变化值logFCi的统计显著值P.valuei的显著性阈值为α;/n(3b)分别对所有基因的突变频率数据的基因和标准化基因表达矩阵数据中的基因进行分类:将所有基因的突变频率数据中突变频率大于Mine-MF的基因作为频繁突变基因,小于Mine-MF的基因为非频繁突变基因,得到频繁突变基因集合和非频繁突变基因集合,同时,利用各基因表达变化值logFCi和各基因表达变化值logFCi的统计显著值P.valuei,对基因表达数据中的基因进行分类,|logFCi|≥δ并且P.valuei≤α的基因为表达值存在差异变化的基因,|logFCi|<δ或者P.valuei>α的基因为表达值不存在差异变化的基因,得到表达值存在差异变化基因集合和表达值不存在差异变化基因集合;/n(3c)对频繁突变基因集合、非频繁突变基因集合和表达值存在差异变化的基因集合和表达值不存在差异变化的基因集合中的基因进行分类:将频繁突变基因集合作为核心基因集合;挑选属于表达值存在差异变化基因集合且属于非频繁突变基因集合中的基因作为次要基因,得到次要基因集合;将属于非频繁突变基因集合且属于表达值不存在差异变化的基因集合中的基因作为边缘基因,得到边缘基因集合;/n(4)获取疾病和各药物的相关性值:/n(4a)将核心基因集合作为疾病特征基因集合,并对疾病特征基因集合进行拆分:将疾病特征基因集合中logFCi>0的基因作为上调基因,并将疾病特征基因集合中logFCi<0的基因作为下调基因,得到上调基因集合Gup和下调基因集合Gdown;/n(4b)对上调基因集合Gup和下调基因集合Gdown中的基因分别排序:按照各基因表达变化值logFCi由大到小的规则,对上调基因集合Gup中的基因和下调基因集合Gdown中的基因分别进行排序,得到有序上调基因列表和有序下调基因列表;/n(4c)获取有序药物作用下各基因表达变化值列表:下载CMap中所有药物作用下基因表达谱数据,并计算各药物作用下基因表达谱数据中每个基因表达变化值FoldChangeij,然后按照各药物作用下基因表达谱数据中每个基因表达变化值FoldChangeij由大到小的规则,对各药物作用下基因表达谱数据中的基因进行排序,得到各药物作用下每个基因表达变化值有序列表,其中,j表示药物作用下基因表达谱数据中的基因序号;/n(4d)计算疾病和各药物的相关性值:将有序上调基因列表作为Kolmogorov-Smirnov的上特征列表,将有序下调基因列表作为Kolmogorov-Smirnov的下特征列表,将各药物作用下每个基因表达变化值有序列表作为Kolmogorov-Smirnov中的参考列表集合,并利用上特征列表、下特征列表和参考列表集合计算疾病和所有药物的相关性值TSr,其中,r表示药物序号;/n(5)计算疾病和各药物的相关性值TSr的绝对值,并按照这些绝对值由大到小的规则,对所有药物进行排序,得到所有药物的排名;/n(6)获取对疾病具有潜在治疗效果的候选药物:从相关数据库中下载疾病的已知治疗药物集合Ω,并通过疾病的已知治疗药物集合Ω中的药物在所有药物中的排名分布,计算所有已知治疗药物排名前D,D=10,20,30,...个药物的准确率PD,将准确率PD=λ的所有药物排名前D个药物中TSr<0且 的药物挑选出来,得到所有对疾病具有潜在治疗效果的候选药物,其中,D表示药物数目。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710429774.X/,转载请声明来源钻瓜专利网。