[发明专利]基于多维特征的蛋白质性质预测方法、装置和计算设备在审
申请号: | 202010474289.6 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111627494A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 王天元;翟珂;黄健;张琳;赖力鹏;温书豪;马健 | 申请(专利权)人: | 北京晶派科技有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B35/00;G16B15/20 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;赵爱军 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多维 特征 蛋白质 性质 预测 方法 装置 计算 设备 | ||
本发明公开了一种基于多维特征的蛋白质性质预测方法,在计算设备中执行,计算设备包括蛋白质性质预测模型,该模型的输入为组装后的蛋白质特征、输出为预测的蛋白质性质,该方法包括:获取待测蛋白质的序列数据和结构数据,并从中分别提取待测蛋白质的氨基酸序列特征、指定残基特征和三维结构图特征,其中氨基酸序列特征代表包括氨基酸组成和物理化学性质,指定残基特征包括指定残基的自身属性和环境属性,三维结构图特征包括残基节点属性和边属性;以及将所提取的三种特征组装为蛋白质特征,并采用蛋白质性质预测模型对蛋白质特征进行处理,得到待测蛋白质的预测性质。本发明还一并公开了对应的基于多维特征的蛋白质性质预测装置和计算设备。
技术领域
本发明涉及药物虚拟筛选领域,尤其涉及一种基于多维特征的蛋白质性质预测方法、装置和计算设备。
背景技术
众所周知,药物研发是一个漫长的过程,存在着研发周期长,研发成果率低,研发费用高的困境。而随着计算机技术的更新以及大数据技术的发展,人工智能正在各行各业中发挥巨大的应用价值,在制药行业也受到了广泛的关注。在新药发现过程中,虚拟筛选可以提高活性分子的富集,通过对化合物的性质进行预测,可以节约大量的人力、物力,缩短药物研发周期,加速研究成果的转化,因此近年来已引起科研机构和制药公司的高度重视。
在进行虚拟药物筛选时,需要将蛋白质进行矢量化以提取其特征表示,使计算机可以理解蛋白数据。但目前的蛋白特征提取都比较单一,缺少能从多个角度提取蛋白的通用工具,极大限制了对生物大分子的机器学习建模。
发明内容
为此,本发明提供了一种基于多维特征的蛋白质性质预测方法、装置和计算设备,以力图解决或至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种基于多维特征的蛋白质性质预测方法,适于在计算设备中执行,计算设备包括蛋白质性质预测模型,该模型的输入为组装后的蛋白质特征、输出为预测的性质属性,所述方法包括步骤:获取待测蛋白质的序列数据和结构数据;从序列数据和结构数据中分别提取所述待测蛋白质的氨基酸序列特征、指定残基特征和三维结构图特征,其中氨基酸序列特征包括氨基酸组成和物理化学性质,指定残基特征包括指定残基的自身属性和环境属性,三维结构图特征包括残基节点属性和边属性;以及将氨基酸序列特征、指定残基特征和三维结构图特征组装为蛋白质特征,并采用蛋白质性质预测模型对蛋白质特征进行处理,得到待测蛋白质的性质属性。
可选地,在根据本发明的蛋白质性质预测方法中,氨基酸序列特征包括以下至少一种:氨基酸的出现频率、连续N个氨基酸的群组特征、序列二进制特征、氨基酸指数特征、氨基酸指数的自动相关性、蛋白质序列顺序相关性、氨基酸结构和性质分布特征。
可选地,在根据本发明的蛋白质性质预测方法中,三维结构图表示为节点和边,每个节点代表一个残基,并标注有蛋白质链的编号、残基编号和氨基酸类型,每条边代表两个残基之间的相互作用。
可选地,在根据本发明的蛋白质性质预测方法中,相互作用包括以下至少一种:疏水作用、二硫键、氢键、离子键、芳环相互作用、芳环和硫的相互作用、阳离子和π键的相互作用、以及骨架原子作用。
可选地,在根据本发明的蛋白质性质预测方法中,自身属性包括以下至少一种:残基的溶剂可及表面积、残基中所有原子的温度因子均值、残基中所有原子与溶剂可及表面的距离均值、以及残基肽键骨架的二面角。
可选地,在根据本发明的蛋白质性质预测方法中,环境属性包括残基所在区域的二级结构和/或残基周围预定距离内的碳原子数量。
可选地,在根据本发明的蛋白质性质预测方法中,残基节点属性包括以下至少一种:残基氨基酸类别、等电点、分子量、相邻节点数、相互作用类别。
可选地,在根据本发明的蛋白质性质预测方法中,边属性包括节点对的最短路径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京晶派科技有限公司,未经北京晶派科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010474289.6/2.html,转载请声明来源钻瓜专利网。