[发明专利]一种抗菌蛋白质或多肽活性关系表征的方法无效
申请号: | 201210139079.7 | 申请日: | 2012-05-08 |
公开(公告)号: | CN102663271A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 舒茂;林治华;张云茹;路亚阔 | 申请(专利权)人: | 重庆理工大学 |
主分类号: | G06F19/24 | 分类号: | G06F19/24 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 徐宏;吴彦峰 |
地址: | 400054 *** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 抗菌 蛋白质 多肽 活性 关系 表征 方法 | ||
技术领域
本发明氨基酸结构表征领域。
背景技术
蛋白质的诸多生物学功能与特定肽链的氨基酸排列顺序亦有着十分密切的关系,因此研究肽的定量构效关系对于研究其在生物体内的作用机理,以及肽类新药的研究与开发,同时对蛋白质的结构与功能研究都具有十分重要的意义。多肽具有高活性、高选择性及副作用小等特点,现已成为药物研究热点之一。非编码氨基酸在自然界普遍存在,在药物设计中对氨基酸结构改造或多肽修饰起到重要作用。近年来随着拟肽学的发展,已认识到需要对含有非标准编码氨基酸在内的肽及其衍生物进行定量构效关系(QSAR) 研究才能满足相关学科领域发展要求。
在QSAR研究中,普遍采用氨基酸残基的参数定量描述多肽的化学结构。目前已有理化性质和量化计算描述子,这些描述子主要表征编码氨基酸,由于非编码氨基酸多样性以及实验参数收集困难,使得对其发展一组高效的描述子体系变得极为艰难,因此该类研究报道很少。结构拓扑描述子是完全不同于传统物理化学参数的结构表征方法,它基于分子图中拓扑不变量将化合物转化为一组具数学抽象意义的特征参数,从而在纯理论层面上实现分子结构表征,如 Winer指数、Randic指数和Balaban指数等在QSAR研究中得到了广泛地应用。
发明内容
本发明的目的是:通过拓扑计算得到一种新型氨基酸拓扑描述子矢量,它能对任何天然及非天然氨基酸结构进行定量表征,进而用于表征抗菌肽活性关系。
本发明的上述目的是通过如下技术方案实现的:一种抗菌蛋白质或多肽活性关系表征方法,包括如下步骤:
1)选取氨基酸,使用描述子计算软件对每个氨基酸生成拓扑描述子参数;
2)采用主成分分析(PCA)进行变量位数压缩提取,得到各种氨基酸的拓扑描述子矢量;
3)对待表征活性关系的蛋白质或多肽用拓扑描述子矢量描述子进行结构表征;
4)将步骤3得到的描述子变量用于GA-PLS或SMR-MLR建模分析。
具体而言,步骤1是将166种氨基酸使用描述子计算软件对每个氨基酸生成 至少85个拓扑描述子参数,其中优选为85个拓扑描述子参数。可采用的计算软件包括Chem3D 8.0、Codessa 2.7 和 Dragon 1.1等。
在本发明中,采用的166种氨基酸来源于从多篇文献。其中,1-20为20种编码氨基酸,其余是非编码氨基酸及人工修饰非蛋白氨基酸,如鸟氨酸、羟脯氨酸、高丝氨酸等。
由于拓扑描述子表征分子整体结构特征,不同描述子参数之间可能存在较大信息重叠,且直接使用85种参数来表征序列中单个氨基酸残基将会导致造成实际应用过于复杂、干扰因素太多等问题。因此,在步骤2中,采用主成分分析(PCA)进行变量维数压缩提取。首先对原始变量矩阵X166×85进行数据标准化处理(autoscaling),在此基础上运用PCA得到了6个显著主成分,其分别解释原始变量矩阵66.35%、8.23%、6.63%、4.84%、4.601%和2.86%的方差,累积解释方差为93.52%。对于每个氨基酸所对应的6个显著主成分得分,它是由氨基酸85个原始变量值与每个主成分得分系数的乘积计算而来,当使用这6个主成分得分矢量来替代原始变量矩阵时仅损失6.48%的信息。这里称166种氨基酸6个显著成分得分为氨基酸拓扑描述子矢量VSTPV(principal component score Vector of Structural and Topological Variables),其值参见表1。
表1 166种氨基酸名称及拓扑描述子矢量VSTPV
进一步的,在步骤3中,当使用拓扑描述子矢量对蛋白质或多肽类似序列进行表征时,所包含全部氨基酸残基依次由相应拓扑描述子矢量描述子所代表,对具有n个氨基酸残基的序列,共可用6×n个拓扑描述子矢量串联表征。
在本发明中,所述的多肽可以包括但不限于阳离子抗菌肽、牛乳铁蛋白水解肽。
进一步的,在步骤4中所述的建模分析是指对步骤3得到的拓扑描述子矢量描述子分析,包括:a.用遗传算法-偏最小二乘方法或逐步回归方法挑选与抗菌活性密切相关的结构特征;b.用偏最小二乘法或多元回归法建立抗菌肽定量构效关系分析模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆理工大学,未经重庆理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210139079.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用