[发明专利]一种蛋白质磷酸化修饰位点-疾病关系识别方法、系统、装置及存储介质有效
申请号: | 202010492316.2 | 申请日: | 2020-06-03 |
公开(公告)号: | CN111696621B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 李占潮 | 申请(专利权)人: | 广东药科大学;中山大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16H50/70;G16B50/00 |
代理公司: | 深圳市创富知识产权代理有限公司 44367 | 代理人: | 吴族平 |
地址: | 510240 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 蛋白质 磷酸化 修饰 疾病 关系 识别 方法 系统 装置 存储 介质 | ||
1.一种蛋白质磷酸化修饰位点-疾病关系识别方法,其特征在于,包括以下步骤:
获取疾病信息、蛋白质磷酸化修饰位点信息、氨基酸序列片段信息和临床症状信息,并标记得到关系信息;
所述蛋白质磷酸化修饰位点信息包括与何种疾病相关和与疾病关系属于何种类型,所述氨基酸序列片段信息包括发生磷酸化修饰的氨基酸类型和磷酸化修饰氨基酸在对应蛋白质序列中的位置,所述临床症状信息包括疾病临床症状、疾病名称、同义词和疾病在医学数据库中的ID号;
基于蛋白质磷酸化修饰位点与疾病的关系信息,构建蛋白质磷酸化修饰位点与疾病的关系数据集和非关系数据集;
所述基于蛋白质磷酸化修饰位点与疾病的关系信息,构建蛋白质磷酸化修饰位点与疾病的关系数据集和非关系数据集这一步骤,其具体包括;
基于蛋白质磷酸化修饰位点与疾病的关系信息,生成蛋白质磷酸化修饰位点与疾病的关系对并构建蛋白质磷酸化修饰位点与疾病的关系数据集;
随机抽取蛋白质磷酸化修饰位点信息和疾病信息,得到随机关系并检查该随机关系是否存在于关系数据集;
判断到随机关系不存在于关系数据集,生成蛋白质磷酸化修饰位点与疾病的非关系对;
将蛋白质磷酸化修饰位点与疾病的非关系对收录到蛋白质磷酸化修饰位点与疾病的非关系数据集;
重复生成非关系对和收录的步骤直至生成的非关系数据集与关系数据集大小相等;
根据关系数据集和非关系数据集、蛋白质磷酸化修饰位点对应的氨基酸序列片段信息和临床症状信息,构建蛋白质磷酸化修饰位点与疾病的关系特征向量和非关系特征向量;
将关系特征向量和非关系特征向量输入到随机森林模型,得到蛋白质磷酸化修饰位点与疾病关系的结果;
所述将关系特征向量和非关系特征向量输入到随机森林模型还包括构建随机森林模型,所述构建随机森林模型包括以下步骤;
根据蛋白质磷酸化修饰位点与疾病的关系对,得到关系对特征;
根据蛋白质磷酸化修饰位点与疾病的非关系对,得到非关系对特征;
选取部分关系对特征、非关系对特征、关系对信息和非关系对信息输入到随机森林模型进行训练;
根据剩余的关系对特征、非关系对特征、关系对信息和非关系对信息对随机森林模型进行测试,完成随机森林模型的构建。
2.根据权利要求1所述一种蛋白质磷酸化修饰位点-疾病关系识别方法,其特征在于,所述根据蛋白质磷酸化修饰位点与疾病的关系对,得到关系对特征这一步骤,其具体包括:
根据蛋白质磷酸化修饰位点与疾病的关系对中的蛋白质磷酸化修饰位点信息,基于BLOSOUM62矩阵计算对应多肽序列的生物统计特征,得到第一生物统计特征;
根据蛋白质磷酸化修饰位点与疾病的关系对中的疾病信息,获取对应的临床症状信息并构建症状特征,得到第一症状特征;
根据蛋白质磷酸化修饰位点与疾病的关系对、第一生物统计特征和第一症状特征构建蛋白质磷酸化修饰位点与疾病信息关系对特征。
3.根据权利要求2所述一种蛋白质磷酸化修饰位点-疾病关系识别方法,其特征在于,所述根据蛋白质磷酸化修饰位点与疾病的非关系对,得到非关系对特征这一步骤,其具体包括:
根据蛋白质磷酸化修饰位点与疾病的非关系对中的蛋白质磷酸化修饰位点信息,基于BLOSOUM62矩阵计算对应多肽序列的生物统计特征,得到第二生物统计特征;
根据蛋白质磷酸化修饰位点与疾病的非关系对中的疾病信息,获取对应的临床症状信息并构建症状特征,得到第二症状特征;
根据蛋白质磷酸化修饰位点与疾病的非关系对、第二生物统计特征和第二症状特征构建蛋白质磷酸化修饰位点与疾病信息非关系对特征。
4.根据权利要求3所述一种蛋白质磷酸化修饰位点-疾病关系识别方法,其特征在于,所述完成随机森林模型的构建采用五折交叉验证法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东药科大学;中山大学,未经广东药科大学;中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010492316.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种离子液体增塑聚酰胺56工业丝的制备方法
- 下一篇:重心测量装置以及方法