[发明专利]基于多维特征的蛋白质性质预测方法、装置和计算设备在审
申请号: | 202010474289.6 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111627494A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 王天元;翟珂;黄健;张琳;赖力鹏;温书豪;马健 | 申请(专利权)人: | 北京晶派科技有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B35/00;G16B15/20 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;赵爱军 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多维 特征 蛋白质 性质 预测 方法 装置 计算 设备 | ||
1.一种基于多维特征的蛋白质性质预测方法,适于在计算设备中执行,所述计算设备包括蛋白质性质预测模型,该模型的输入为组装后的蛋白质特征、输出为预测的性质属性,所述方法包括步骤:
获取待测蛋白质的序列数据和结构数据;
从所述序列数据和结构数据中分别提取所述待测蛋白质的氨基酸序列特征、指定残基特征和三维结构图特征,所述氨基酸序列特征包括氨基酸组成和物理化学性质,所述指定残基特征包括指定残基的自身属性和环境属性,所述三维结构图特征包括残基节点属性和边属性;以及
将所述氨基酸序列特征、指定残基特征和三维结构图特征组装为蛋白质特征,并采用所述蛋白质性质预测模型对所述蛋白质特征进行处理,得到所述待测蛋白质的预测性质。
2.如权利要求1所述的方法,其中,所述氨基酸序列特征包括以下至少一种:
氨基酸的出现频率、连续N个氨基酸的群组特征、序列二进制特征、氨基酸指数特征、氨基酸指数的自动相关性、蛋白质序列顺序相关性、氨基酸结构和性质分布特征。
3.如权利要求1或2所述的方法,其中,
三维结构图表示为节点和边,每个节点代表一个残基,并标注有蛋白质链的编号、残基编号和氨基酸类型,每条边代表两个残基之间的相互作用。
4.如权利要求3所述的方法,其中,所述相互作用包括以下至少一种:
疏水作用、二硫键、氢键、离子键、芳环相互作用、芳环和硫的相互作用、阳离子和π键的相互作用、以及骨架原子作用。
5.如权利要求1-4中任一项所述的方法,其中,所述自身属性包括以下至少一种:
残基的溶剂可及表面积、残基中所有原子的温度因子均值、残基中所有原子与溶剂可及表面的距离均值、以及残基肽键骨架的二面角。
6.如权利要求1-5中任一项所述的方法,其中,所述环境属性包括残基所在区域的二级结构和/或残基周围预定距离内的碳原子数量。
7.如权利要求1-6中任一项所述的方法,其中,所述残基节点属性包括以下至少一种:
残基氨基酸类别、等电点、分子量、相邻节点数、相互作用类别。
8.一种基于多维特征的蛋白质性质预测装置,适于驻留在计算设备中,所述计算设备包括蛋白质性质预测模型,该模型的输入为组装后的蛋白质特征、输出为预测的性质属性,所述装置包括:
数据获取模块,适于获取待测蛋白质的序列数据和结构数据;
特征生成模块,适于从所述序列数据和结构数据中分别提取所述待测蛋白质的氨基酸序列特征、指定残基特征和三维结构图特征,所述氨基酸序列特征包括氨基酸组成和物理化学性质,所述指定残基特征包括指定残基的自身属性和环境特征,所述三维结构图特征包括残基节点属性和边属性;以及
性质预测模块,适于将所述氨基酸序列特征、指定残基特征和三维结构图特征组装为蛋白质特征,并采用所述蛋白质性质预测模型对所述蛋白质特征进行处理,得到所述待测蛋白质的预测性质。
9.一种计算设备,包括:
存储器;
一个或多个处理器;
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-7所述方法中的任一方法的指令。
10.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当计算设备执行时,使得所述计算设备执行根据权利要求1-7所述的方法中的任一方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京晶派科技有限公司,未经北京晶派科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010474289.6/1.html,转载请声明来源钻瓜专利网。