[发明专利]基于少量基因的表达谱的药效预测方法、装置和试剂盒在审
申请号: | 202211278396.7 | 申请日: | 2022-10-19 |
公开(公告)号: | CN115905898A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 周文霞;韩露;张永祥;刘港;罗丹;高圣乔;肖智勇;黄晏 | 申请(专利权)人: | 中国人民解放军军事科学院军事医学研究院 |
主分类号: | G06F18/23213 | 分类号: | G06F18/23213;G06F18/24;G06F18/214;G16B25/10;G16B15/30;C12Q1/6844 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 何怀燕 |
地址: | 100039*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 少量 基因 表达 药效 预测 方法 装置 试剂盒 | ||
1.一种用于药物预测的基因谱的筛选方法,其特征在于,包括如下步骤:
利用L1000的公共数据中的978地标基因构建978×978的基因表达相关性矩阵;
利用聚类方法将所述978个基因聚类为N类,在每一类聚类中挑选中心基因,即在同一聚类中与其他基因平均相关性最高的基因作为地标基因;其中,90≤N≤150。
2.根据权利要求1所述的筛选方法,其特征在于,
所述中心基因的挑选是利用基因的共表达特性来筛选一个具有代表性的中心基因作为共表达基因的代表基因,从而构建一个去冗余特征的表达矩阵;
其中,筛选过程利用LR模型来建立并训练反映药物与药物的基因表达谱数据的评分之间关系的MOA预测模型,所述MOA预测模型为二分类模型,所述评分是指利用所述预测模型预测各个药物是否与建立预测模型的药物具有相同或者相似的药物作用机制的概率值;二值分类器训练集包括两个类样本:“正集”和“负集”,“正集”标签引用MedChemExpress库和药物重定位中心的药物MOA注释,“负集”选择低转录活性且没有MOA注释的化合物,并假设它们没有能够在转录组水平上反映的药物特性。
3.根据权利要求1或2所述的筛选方法,其特征在于,
所述聚类方法采用K-means算法和余弦相似性度量来实现;
作为优选,所述聚类方法中采用t分布随机邻域嵌入算法,通过主成分分析对数据进行初始化;
作为优选,采用3折交叉验证对所述MOA预测模型的性能进行评价;交叉验证时,采用分层抽样的方法将阳性和阴性药物集随机分为K个部分,2/3个样本作为训练集来训练所述MOA预测模型,通过对剩下的1/3个样本的测试来评估其敏感性和特异性;此过程执行3次,以3次平均AUROC为评价指标,并记录每次交叉训练过程中模型对阴性和阳性样本集合的概率打分,此过程中将平均AUROC≥0.6的模型视为训练良好的模型。
4.根据权利要求2所述的筛选方法,其特征在于,
从Drug Repurposing Hub信息库中获取药物的药物功能的注释信息,包括药物作用机制;和/或
从LINCS表达谱数据集中获取药物的基因表达谱数据;和/或
从Medchemexpress公司的药物集中整理103个具有特定药物作用机制的药物集;
将每个药物集的药物作用机制作为真实标签,利用每个药物集中药物的基因表达谱数据对所述MOA预测模型进行训练,得到各个药物集的预测模型;再通过各个药物的预测模型分别对基因表达谱数据进行药物作用机制的分析,对基因表达谱数据的MOA预测评分进行排序,从而筛选聚类得到所述地标基因。
5.根据权利要求1-4任一项所述的筛选方法获得用于药物预测的基因集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院军事医学研究院,未经中国人民解放军军事科学院军事医学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211278396.7/1.html,转载请声明来源钻瓜专利网。