[发明专利]一种药物靶标的高通量检索方法有效
申请号: | 201510622520.0 | 申请日: | 2015-09-25 |
公开(公告)号: | CN105205351B | 公开(公告)日: | 2017-11-14 |
发明(设计)人: | 杨家安 | 申请(专利权)人: | 麦科罗医药科技(武汉)有限公司 |
主分类号: | G06F19/24 | 分类号: | G06F19/24;G06F19/16 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 汪俊锋 |
地址: | 430075 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 药物 靶标 通量 检索 方法 | ||
技术领域
本发明涉及一种药物靶标的高通量检索方法,属于生物信息学领域。
背景技术
尽管大多数药物具有较高的选择性,任何药物进入人体或者动物体内都具有与多个蛋白结合的潜在能力。传统方法是通过体外和体内的生物实验的方法检测和预测药物的蛋白靶标。从设计到实施这些实验,都需要消耗大量的时间和资源1,2,3。生物医药研究已经认识到,运用计算机和大数据的方法可以为这些生物实验提高先导信息。这样可以避免研究弯路,节约大量的时间和研究成本。到目前为止,全球共享的蛋白质数据库(PDB)已经积累了大约110,000以上的蛋白质三维结构数据,许多蛋白质和配位体分子相互结合形成复合物。因此蛋白数据库中包含数百个药物分子和数千个其它化学分子4,5。可以运用这些信息来发现药物新靶标,理解药物的作用机理,支持新药研发,开拓已知药物的多功效,以及开发检测疾病分子的试剂等等6。
药物分子与蛋白质受体相互作用的靶点区域通常像一个口袋,被称为结合口袋。结合口袋往往用分子模型来表示围绕药物分子周围的状态,包括空腔的大小,空间构象和物理化学性质。研究药物结合口袋的状态可以运用各种工具在计算机上直接操作可视的分子模型。此外,药物的结合口袋可以通过图像展示,或者通过文字详细描述,这也是目前最为广泛流行的方式。具有挑战性的任务是如何开发有效的工具来描述药物结合口袋的特征。这些方法大致分为三类。首先,在结合药物的氨基酸序列寻找模式的基础上,直接找到一些方法。例如,Sheinerman等人运用CSA数据库提供了两到六个残基从酶的催化残基的主题模板7。研究了八个激酶抑制剂的序列变异,并观察到每个抑制剂的所有高亲和力的目标有类似的残基在特定的位置重要的结合。然而,在另一方面,一些研究发现,许多小分子抑制多个激酶和共享小的整体序列相似性8,9,10,11。其次,一些方法采用了表面上的贡献,根据每个原子的范德瓦尔斯半径,目前的结合口袋,这可能是定量测量的几何形状的结合口袋12,13,14。第三,一些方法提出的结合药物的物理化学性质。cavbase应用pseudospheres代表参与分子结合口袋的原子的位置和理化性质15,16。静电表面的有效位置图,其疏水性和静电势的表面上的补丁的曲率表示。这些方法确实能描述药物结合口袋,但它们很难适用于对大量的蛋白质数据库中的结构筛选。
发明内容
本发明所要解决的技术问题是提供一种药物靶标的高通量检索方法。
发明人在之前专利ZL200880003164.2中,开发了蛋白质折叠形状码(PFSC),为描述蛋白结构指纹创立了基础。通过数学推导得到一组27向量,这组向量能够覆盖任何五个连续氨基酸残基所有可能的折叠形状。用26英文字母加上“$”符号形成27蛋白质折叠形状码(PFSC),与27个向量一一对应。因此,任何已知具有三维结构的蛋白质可以转化为一维的PFSC字母表示。对于蛋白质结构,PFSC码的表达可以从N-端开始至C-端结束,涵盖每5个氨基酸的折叠构象,没有任何遗漏和缺失,包括二级结构片段和三级结构片段。最重要的特点是,所有27PFSC向量具有相关性,可以对蛋白质构象的相似性进行定量评价。
在蛋白质折叠形状码的基础上17,发明人新近开发的药物靶标检索技术(PBSDD)可以高通量检索蛋白质数据库,发现药物的多蛋白靶标。
本发明的药物靶标的高通量检索方法,包括如下步骤:
1)以药物和标靶的复合体为参考,定义药物结合口袋:首先,定义距离药物分子的每一个原子3埃的残基片段,接着,根据氢键相互作用或范德瓦尔斯相互作用,定义关键残基片段,每一个残基片段需要含有一个关键残基片段,关键残基片段的长度等于五个氨基酸;
2)将结合口袋中的所有片段用蛋白质的结构指纹表示(PSF),蛋白质的结构指纹包括氨基酸序列,蛋白质折叠形状码,物理化学性质和向量偶合;
3)输入数字化的药物结合口袋,检索全球已知蛋白结构数据库,进行指纹比对和定量评估,然后按照指纹相似性从高到低排列;
4)选择蛋白折叠码的相似性分数和氨基酸物理化性质的相似性得分同时处于前2千名的结构蛋白为可能靶点区,分析和预测药物的可能靶标蛋白。
步骤1)中所述的药物和标靶的复合体,是药物和已知标靶的复合体,也可以是药物与通过软件筛选出的标靶的复合体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于麦科罗医药科技(武汉)有限公司,未经麦科罗医药科技(武汉)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510622520.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用