[发明专利]一种基于决策树判别环境中化合物对非洲爪蟾是否具有雌激素效应的方法在审
申请号: | 201410321359.9 | 申请日: | 2014-07-07 |
公开(公告)号: | CN104102828A | 公开(公告)日: | 2014-10-15 |
发明(设计)人: | 林志芬;丛永平;郑晓峰;尹大强;陈瑞 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 上海智信专利代理有限公司 31002 | 代理人: | 吴林松 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 决策树 判别 环境 化合物 非洲 是否 具有 雌激素 效应 方法 | ||
1.一种基于决策树判别环境中化合物对非洲爪蟾是否具有雌激素效应的方法,其特征在于:包括以下步骤:
(1)对非洲爪蟾雌激素受体蛋白ERβ进行同源建模及评价;
(2)运用分子模拟软件DS获取化合物的物理参数,以及化合物对小鼠、非洲爪蟾的结合能,分析小鼠-化合物的结合能与非洲爪蟾-化合物的结合能的线性关系;
(3)通过化合物对小鼠的物理参数和结合能建立化合物对小鼠有无雌激素效应的决策树;
(4)利用小鼠和非洲爪蟾结合能之间的线性关系,构建化合物对非洲爪蟾有无雌激素效应的决策树。
2.根据权利要求1所述的方法,其特征在于:所述的步骤(1)中,非洲爪蟾雌激素受体蛋白ERβ的同源建模及评价,包括以下步骤:
(11)以非洲爪蟾的ERβ的一级序列为探针,在NCBI数据库中利用protein-protein blast程序搜索PDB蛋白晶体数据库,得到一系列模板蛋白;
(12)以2J7X为模板,以在NCBI数据库中编号为NP_001124426.1的非洲爪蟾ERβ蛋白的一级氨基酸序列为目标,进行同源建模。
3.根据权利要求1所述的方法,其特征在于:所述的步骤(2),获取化合物与小鼠、非洲爪蟾受体蛋白的相互结合能,包括以下步骤:
(21)、对所建同源模型加Charm力场;
(22)、选择构建同源模型的受体蛋白为受体,根据同源建模时保留了小鼠的配体选定结合区域;
(23)、进行化合物与受体蛋白的对接;
(24)、对接结束后,获取化合物与小鼠、非洲爪蟾的受体蛋白的相互结合能。
4.根据权利要求1所述的方法,其特征在于:所述的步骤(2)中,化合物的物理参数,包括化合物的疏水性logP、分子间相互结合的表面正电荷区域的形状、电荷信息Jurs-PNSA-2、Jur-PRCS以及分子宽度的空间参数shadow XY。
5.根据权利要求1所述的方法,其特征在于:所述的步骤(2)中,获取化合物的物理参数,具体包括以下步骤:通过已有的小鼠蛋白结构运用DS软件计算小鼠的各项参数,包括logP、Jurs-PNSA-2、Jur-PRCS和shadow XY fraction以及结合能,通过同源建模的非洲爪蟾的蛋白结构运用DS软件计算非洲爪蟾的各项参数,包括logP、Jurs-PNSA-2、Jur-PRCS和shadow XY fraction以及结合能。
6.根据权利要求1所述的方法,其特征在于:所述步骤(4)中化合物对非洲爪蟾有无雌激素效应的决策树,包括以下步骤:
(41)、同源建模以非洲爪蟾的ERβ的一级序列为探针,在NCBI数据库中利用protein-protein blast程序搜索PDB蛋白晶体数据库,得到一系列模板蛋白,以2J7X为模板,以在NCBI数据库中编号为NP_001124426.1的非洲爪蟾ERβ蛋白的一级氨基酸序列为目标,进行同源建模;
(42)、参数计算用同源建模建好的模型通过分子对接结算出化合物的物理参数logP、Jur-PNSA-2、Jur-RPCS和shadow XY及分子模拟的结合能;
(43)、利用matlab中的Decesion Tree模块建立关于化合物结构参数logP、Jur-PNSA-2、Jur-RPCS、shadow XY,通过非洲爪蟾和小鼠雌激素受体蛋白对接的结合能的线性关系建立有关非洲爪蟾的决策树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410321359.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:配电网对光伏电源接纳能力的测评方法
- 下一篇:一种对心电数据精度转换的方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用