[发明专利]一种预测多肽毒性的方法在审
申请号: | 201911365601.1 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111128295A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 莫凡;王奎;孙英强;陈荣昌 | 申请(专利权)人: | 杭州纽安津生物科技有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00;G06K9/62 |
代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 金方玮 |
地址: | 310000 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 预测 多肽 毒性 方法 | ||
本发明公开了一种预测多肽毒性的方法,通过选择ToxinPred文章中提供的数据集、SATPdb数据库和UniPort数据库中的多肽作为训练数据,再通过二肽组成矩阵的数据处理方式输入模型中训练,模型采用RF,LDA这两种模型结合进行训练生成了的预测模型,再加上BLAST比对;这样的方法能够将真正的毒性肽尽可能的全部找出,降低临床应用的危险度安全风险。
技术领域
本发明涉及生物信息领域,特别是一种预测多肽毒性的方法。
背景技术
多肽是多个氨基酸通过缩合反应连接在一起的大分子,广泛存在于生物体细胞的各个角落,参与和执行各项生命活动。大部分多肽对于人体是没有危害的,但自然界中也存在许多有毒性的多肽,例如多数蛇毒或河豚毒素。在合成用于肿瘤免疫治疗的多肽疫苗时,由于制剂也属于多肽,因此在输入人体之前,必须判断合成得到的多肽是否具有毒性,以免引起严重的医疗事故。
目前预测多肽毒性的方法并不多,文献In Silico Approach for PredictingToxicity of Peptides and Proteins(Sudheer et.al,2013)提供了一种用SVM算法预测毒性的思路,并提供了在线工具TOXIN PRED(http://crdd.osdd.net/raghava/toxinpred/)。文献使用了来自ATDB、 SWISSPROT、trEMBL等数据库的5万多条阳性多肽作为训练数据,用SVM模型进行训练。文章测试结果显示该方法的分类效果最高达到了98%。然而,用SATPdb数据库中toxic peptide 子数据库(http://crdd.osdd.net/raghava/satpdb/toxic.fasta)的多肽对TOXIN PRED进行测试后,发现结果与预期有很大的差距,输入10组的250条阳性多肽,测试出阴性占比过高,如下表所示。据下表所示,统计测试之后确认TOXIN PRED存在漏洞,对文献的结果也存在疑问。
测试阳性肽数量 预测为阴性的数量 预测阴性的占比 250 131 52.40% 250 106 42.40% 250 199 79.60% 250 214 85.60% 250 172 68.80% 250 189 75.60% 250 218 87.20% 250 210 84.00% 250 155 62.00% 250 170 68.00%
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州纽安津生物科技有限公司,未经杭州纽安津生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911365601.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种球形电机的滑模控制方法
- 下一篇:适用于地外空间的生物培养系统