[发明专利]基于少量基因的表达谱的药效预测方法、装置和试剂盒在审
申请号: | 202211278396.7 | 申请日: | 2022-10-19 |
公开(公告)号: | CN115905898A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 周文霞;韩露;张永祥;刘港;罗丹;高圣乔;肖智勇;黄晏 | 申请(专利权)人: | 中国人民解放军军事科学院军事医学研究院 |
主分类号: | G06F18/23213 | 分类号: | G06F18/23213;G06F18/24;G06F18/214;G16B25/10;G16B15/30;C12Q1/6844 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 何怀燕 |
地址: | 100039*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 少量 基因 表达 药效 预测 方法 装置 试剂盒 | ||
一种基于少量基因的表达谱的药效预测方法、装置和试剂盒。用于药物预测的基因谱的筛选方法包括:利用L1000的公共数据中的978地标基因构建978×978的基因表达相关性矩阵;利用聚类方法将所述978个基因聚类为N类,在每一类聚类中挑选中心基因,即在同一聚类中与其他基因平均相关性最高的基因作为地标基因;其中,90≤N≤150。相比于L1000技术,本发明的方法减少了需检测的基因种类,且无需使用一种磁珠按比例检测两种基因,可有效降低检测成本,提高检测效率,适用于大规模化合物转录组数据采集;本发明预测准确率高,而检测成本却极大地降低。
技术领域
本发明涉及药物作用机制预测和药物重定位技术领域,具体地涉及一种基于少量基因的表达谱的药效预测方法、装置和试剂盒。
背景技术
L1000技术是由Broad研究所开发的一项集合液相芯片、基因关联、人工智能等方法的颠覆性技术,其理论基础是利用基因表达之间的高度关联性将检测的基因种类降低至978种基因,然后对这978种基因的表达谱进行计算推断可得到全转录组的表达信息。其原理是利用包含通用引物序列及编码序列的基因特异性探针进行连接介导的扩增(LigationMediated Amplification,LMA),并结合Luminex液相芯片技术及每种Luminex磁珠以固定数量比(2:1)检测两种表达差异较大的基因的方法来检测978种基因的表达数据,从而使整个L1000技术更适用于大规模数据的获取。然而,由于L1000技术涉及约1000种基因的多重反应以及一种磁珠检测两种基因,容易导致其数据稳定性差,检测效率低。此外L1000最重要的应用场景之一便是基于表达谱间的相似性进行药物间关联分析,即“关联有罪(guiltby association)”策略。其基本假设是如果药物之间具有相似的转录组学特征,那么它们也可能具有相似的靶点和适应症。在过去曾开展过许多大规模相似性关联分析的研究,其主要通过将目标药物与大量已注释了靶点、作用机制和适应症等信息的参考药物进行比对,挖掘药物-药物间未知的潜在联系,从而为目标药物划分可能的新作用类别。但由于基因的共表达特点,这种相似性关联并不总是需要在全基因的转录组层面上进行,包括L1000在内的多项研究均表明只需通过有限的基因表达特征便可以实现表达谱间的相似性评价。因此可能不需要检测978个或者更多的基因也可以实现相似性评价,进而实现药物作用机制的预测及药物重定位工作,因此业界迫切需要研究开发一种远少于978个基因的表达谱的药效预测方法和装置,以便减少L1000多重反应的复杂性,提高检测效率,降低成本。
发明内容
有鉴于此,本发明的主要目的在于提供一种基于少量基因的表达谱的药效预测方法、装置和试剂盒,以期至少部分地解决上述技术问题。
为了实现上述目的,作为本发明的第一个方面,提出了一种用于药物预测的基因集的筛选方法,包括如下步骤:
利用L1000的公共数据中的978地标基因构建978×978的基因表达相关性矩阵;
利用聚类方法将所述978个基因聚类为N类,在每一类聚类中挑选中心基因,即在同一聚类中与其他基因平均相关性最高的基因作为地标基因;其中,90≤N≤150。
其中,所述中心基因的挑选是利用基因的共表达特性来筛选一个具有代表性的中心基因作为共表达基因的代表基因,从而构建一个去冗余特征的表达矩阵;
其中,筛选过程利用LR模型来建立并训练反映药物与药物的基因表达谱数据的评分之间关系的MOA预测模型,所述MOA预测模型为二分类模型,所述评分是指利用所述预测模型预测各个药物是否与建立预测模型的药物具有相同或者相似的药物作用机制的概率值;二值分类器训练集包括两个类样本:“正集”和“负集”,“正集”标签引用MedChemExpress库和药物重定位中心的药物MOA注释,“负集”选择低转录活性且没有MOA注释的化合物,并假设它们没有能够在转录组水平上反映的药物特性。
其中,所述聚类方法采用K-means算法和余弦相似性度量来实现;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院军事医学研究院,未经中国人民解放军军事科学院军事医学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211278396.7/2.html,转载请声明来源钻瓜专利网。