[发明专利]一种分析预测癌症突变影响LIR模体功能的方法有效
申请号: | 201810378036.1 | 申请日: | 2018-04-25 |
公开(公告)号: | CN108763872B | 公开(公告)日: | 2019-12-06 |
发明(设计)人: | 薛宇;邓万锟;贾大 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B35/00;G16B40/00 |
代理公司: | 42201 华中科技大学专利中心 | 代理人: | 许恒恒;李智<国际申请>=<国际公布>= |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 突变 癌症 模体 肽段 候选肽 概率 影响方式 贝叶斯 可选 预测 数据训练 预测模型 分析 研究 | ||
1.一种分析预测癌症突变影响LIR模体功能的方法,其特征在于,包括以下步骤:
(1)利用LIR模体数据训练预测模型;该模型用于以LIR模体数据作为参照物评价某一肽段数据与这些参照物之间的相似度分数;
(2)利用所述步骤(1)得到的预测模型,基于生物的正常蛋白质序列和该生物的癌症突变的肽段数据,对突变前后的肽段数据与所述LIR模体数据之间的相似度分别打分;
(3)利用所述步骤(1)得到的预测模型对候选肽段的肽段数据进行打分,并计算得出打分结果与该候选肽段对应的肽段数据其属于真实LIR模体或非真实LIR模体的贝叶斯概率之间的关系;接着,将癌症突变前后对应的肽段分别作为候选肽段,并将所述步骤(2)得到的对应打分结果代入所述关系,从而得到所述癌症突变前后对应的肽段数据的贝叶斯概率;
(4)接着,利用所述步骤(3)得出的所述癌症突变前后对应的肽段数据的贝叶斯概率进一步计算该癌症突变对于LIR功能的若干种可选影响方式的概率,进而判断得出该癌症突变对于LIR功能的最终影响方式;
并且,所述步骤(3)是先以LIR模体数据作为阳性数据,以与所述阳性数据中任意一个LIR模体数据出现在同一条蛋白上且符合[W/Y/F]XX[L/I/V]序列模式但未被所述阳性数据涵盖的肽段数据作为阴性数据,通过对阳性数据打分所得分值、以及阴性数据打分所得分值分别进行拟合正态分布,从而分别得到阳性数据和阴性数据分值分布的概率密度函数pdf_p和pdf_n,从而进一步在所述步骤(3)中基于阳性数据分值分布的概率密度函数pdf_p和阴性数据分值分布的概率密度函数pdf_n得出候选肽段的打分结果与该候选肽段对应的肽段数据其属于真实LIR模体或非真实LIR模体的贝叶斯概率之间的关系;
所述步骤(3)中,记所述候选肽段为pep,所述预测模型对该候选肽段的肽段数据进行打分给出的分值为Spep,则该候选肽段其预测结果为真实LIR模体的概率p(True|Spep)满足:
该候选肽段其预测结果为非真实LIR模体的概率p(False|Spep)满足:
其中,pdf_p(Spep)、pdf_n(Spep)为将Spep分别代入所述概率密度函数pdf_p和所述概率密度函数pdf_n对应得到的值,p(True)和p(False)均为预先设定的值;
所述步骤(4)中,所述LIR功能的若干种可选影响方式包括突变前属于真实LIR模体而突变后属于非真实LIR模体、以及突变前属于非真实LIR模体而突变后属于真实LIR模体两种情况;所述最终影响方式对应为所述若干种可选影响方式中的概率最大值者。
2.如权利要求1所述分析预测癌症突变影响LIR模体功能的方法,其特征在于,所述步骤(1)中,所述LIR模体数据为多个LIR模体数据,任意一个LIR模体数据包括14个氨基酸,这14个氨基酸由核心LIR模体的4个氨基酸、以及该核心LIR模体左侧的6个氨基酸和右侧的4个氨基酸构成。
3.如权利要求1所述分析预测癌症突变影响LIR模体功能的方法,其特征在于,所述步骤(2)中,所述生物的正常蛋白质序列为人类全蛋白质序列,所述生物的癌症突变的肽段数据为人类癌症突变的肽段数据。
4.如权利要求1所述分析预测癌症突变影响LIR模体功能的方法,其特征在于,所述p(True)为所述步骤(1)得到的预测模型利用留一法检测得到的ROC曲线的曲线下面积,所述p(False)为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810378036.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于第三代测序序列的补洞方法及装置
- 下一篇:一种基因分类方法及相关设备