[发明专利]一种基于特征优化的G蛋白偶联特异性预测的方法在审
申请号: | 201711211883.0 | 申请日: | 2017-11-28 |
公开(公告)号: | CN108052795A | 公开(公告)日: | 2018-05-18 |
发明(设计)人: | 江振然;余蔚明 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 上海麦其知识产权代理事务所(普通合伙) 31257 | 代理人: | 董红曼 |
地址: | 200062 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 优化 蛋白 特异性 预测 方法 | ||
1.一种基于特征优化的G蛋白偶联特异性预测的方法,其特征在于,包括如下步骤:
从gpDB数据库中获取GPCRs与G蛋白之间的偶联信息,构建待测的蛋白序列数据集;
提取所述数据集内蛋白序列数据的多种不同生物学特征,获得原始特征信息;
同时使用子预测模型对原始特征信息进行特征评价和有效特征选择,选取与GPCR/G蛋白偶联特异性相关的最优特征子集;
综合上述特征优化信息,使用支持向量机分类器方法构建用于G蛋白偶联特异性预测的SVM分类模型;
基于SVM分类模型获得用于预测G蛋白各偶联特异性的子预测模型。
2.如权利要求1所述的基于特征优化的G蛋白偶联特异性预测的方法,其特征在于,构建待测的蛋白序列数据集包括:从数据库中获取GPCRs与G蛋白的单偶联信息,构建单偶联特异性预测数据子集。
3.如权利要求1所述的基于特征优化的G蛋白偶联特异性预测的方法,其特征在于,构建待测的蛋白序列数据集包括:从数据库中获取GPCRs与G蛋白的多偶联信息,构建多偶联特异性预测数据子集。
4.如权利要求1、2或3所述的基于特征优化的G蛋白偶联特异性预测的方法,其特征在于,针对所述待测的蛋白序列数据集,进一步去除其中没有预测出7跨膜螺旋的蛋白序列。
5.如权利要求1、2或3所述的基于特征优化的G蛋白偶联特异性预测的方法,其特征在于,针对所述待测的蛋白序列数据集,进一步去除相似度大于98%的蛋白序列。
6.如权利要求1所述的基于特征优化的G蛋白偶联特异性预测的方法,其特征在于,通过GO语义相似性提取所述数据集内蛋白序列数据的生物学特征;GO术语包括分子功能、生化途径和细胞组成信息,采用csbl.go R包计算任意两个靶标蛋白之间的GO语义相似性,构建三个表征蛋白质语义相似性的矩阵
7.如权利要求1所述的基于特征优化的G蛋白偶联特异性预测的方法,其特征在于,通过细胞内各个区域长度提取所述数据集内蛋白序列数据的生物学特征,采用细胞膜区域预测工具进行G蛋白偶联受体胞内区域序列的有效选取。
8.如权利要求1所述的基于特征优化的G蛋白偶联特异性预测的方法,其特征在于,通过组成转移分布提取所述数据集内蛋白序列数据的生物学特征,包括如下步骤:
采用氨基酸组成转移分布特征编码方法,考察极性、电荷、极化率、水溶性、范德华体积、氨基酸疏水性、二级结构、侧链基团八种氨基酸物理化学性质,在整条蛋白质序列上提取的组成转移分布特征168维,在4个细胞内区域上提取的特征共672维。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711211883.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用