[发明专利]基于复杂度和分子指纹的药物-靶标结合预测方法有效

专利信息
申请号: 201210439995.2 申请日: 2012-11-07
公开(公告)号: CN102930179A 公开(公告)日: 2013-02-13
发明(设计)人: 肖绚;闵建亮 申请(专利权)人: 景德镇陶瓷学院
主分类号: G06F19/10 分类号: G06F19/10
代理公司: 暂无信息 代理人: 暂无信息
地址: 333001 *** 国省代码: 江西;36
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 复杂度 分子 指纹 药物 靶标 结合 预测 方法
【权利要求书】:

1. 一种基于复杂度和分子指纹的药物-靶标结合预测方法,其特征在于,该预测方法包括以下步骤:

步骤一,基于复杂度和二联体生成蛋白质伪氨基酸成分,结合蛋白质序列氨基酸成分将靶标蛋白质序列转换成421维空间向量;

步骤二,通过药物分子指纹软件将药物分子描述成一个256维空间向量;

步骤三,将描述蛋白质序列的421维空间向量和描述药物分子的256维空间向量组合成677维空间向量,作为药物-靶标结合描述符;

步骤四,采用模糊K近邻法对训练集进行训练,得出预测器最佳参数,将药物-靶标结合描述符输入预测器预测药物和靶标是否有关联。

2.如权利要求1所述的预测方法,其特征在于,蛋白质序列采用复杂度和二联体组成的伪氨基酸成分离散模型如下:

蛋白质一级结构是由20种英文字母A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W和Y组成,这20个字母分别代表20种氨基酸,蛋白质一级结构决定了蛋白质的三维结构和功能;

复杂度伪氨基酸成分是用于描述序列复杂性,Ziv-Lempel复杂度测量主要反映了符号序列中的重复性,在我们的方法中采用Ziv-Lempel复杂度;

Ziv-Lempel复杂度可用合成整个序列所需要的最小步来表示;在合成过程中,只有两个步骤是允许的:加上一个新的符号确保每个序列子串都有唯一性或者从已合成的序列中拷贝最长的子串;

氨基酸二联体成分是指20种氨基酸两两组合排列关系,共有400种,如:AC、AD、AE、EA、DA等,氨基酸成分是指单个氨基酸在蛋白质序列中出现的频率,氨基酸二联体成分是指在序列中氨基酸二联体出现的频率;

蛋白质离散模型常用于描述蛋白质序列,其中伪氨基酸成分法是最常有的,其公式如下:

这里P表示蛋白质序列,前面20维向量表示20种氨基酸在序列中的比例,后面维向量为伪氨基酸成分,因为氨基酸成分将序列的前后顺序关系全部丢失,所以采用伪氨基酸成分用于描述序列中氨基酸的前后顺序关系,将复杂度和氨基酸二联体出现频率作为伪氨基酸成分,得到蛋白质序列的421维向量描述,

这里p1是复杂度因子,p2p401是氨基酸二联体出现频率,时第个伪氨基酸成分的权重因子。

3.如权利要求1所述的预测方法,其特征在于,药物分子指纹描述如下:

药物分子都是已知三维结构的,为了对药物-靶标结合进行预测,采用分子指纹OpenBabel工具,将药物三维结构转换成数字向量,OpenBabel输出有四种格式 FP2, FP3, FP4 and MACCS,采用FP2 将药物分子三维结构转换成256维的空间向量,这些向量都在0到15之间。

4.如权利要求1所述的预测方法,其特征在于,基于模糊K近邻的药物-靶标结合预测如下:

将描述蛋白质靶标和药物分子的向量组合成一个新的向量作为描述药物和蛋白质靶标结合对用于训练,训练集包括蛋白质序列和药物分子结合对,将其作为正训练集,负训练集采用不包含在正训练集中的蛋白质与药物结合对,机器学习方法采用模糊K近邻法,通过训练得到最佳参数,就可对药物-靶标进行预测。

5.如权利要求1所述的预测方法,其特征在于,采用该预测方法用于GPCR蛋白靶标与药物结构预测时,步骤如下:

将药物分子代码输入到KEGG数据库中,得到包含此药物分子化学结构信息的mol文件,将此mol文件输入到OpenBabel软件中,使用FP2格式分子指纹,可得到256个0到15的值,作为描述药物分子的256维向量;

将描述蛋白质靶标的421维向量组合描述药物分子的256维向量,得到描述药物-靶标结合对677维向量。

6.如权利要求5所述的预测方法,其特征在于,模糊K近邻法中参数m=1.75 和 K=1时得到最佳预测,预测成功率为88.7%。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于景德镇陶瓷学院,未经景德镇陶瓷学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210439995.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top