[发明专利]一种基于有机化合物分子三维结构计算的结构描述符在审
申请号: | 201710718151.4 | 申请日: | 2017-08-21 |
公开(公告)号: | CN107516012A | 公开(公告)日: | 2017-12-26 |
发明(设计)人: | 廖立敏;李建凤 | 申请(专利权)人: | 内江师范学院 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 泰州地益专利事务所32108 | 代理人: | 谭建成 |
地址: | 641100 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 有机化合物 分子 三维 结构 计算 描述 | ||
技术领域
本发明具体涉及一种基于有机化合物分子三维结构计算的结构描述符,属于化合物定量结构-性质关系(QSPR/QSAR)研究方法技术领域。
背景技术
化合物结构决定性质,性质是化合物结构的反映。分子结构与性质之间的定量关系的构建,需要引入相应的结构描述符。长期以来,研究者们在这方面已经做了许多有意义的工作。通过利用分子的几何结构、拓扑性质及连接特征和各种物化参数进行结构描述,然后建立QSPR/QSAR模型来预测化合物的各种性质,见论文:广义相关指数用于持久性环境污染物的定量结构-色谱保留关系研究[J].分析化学,2006,34(8):1096-1100。但上述方法都是二维(2D)结构描述符,难以再现分子真实空间立体结构,对顺反异构等结构难以区分。三维(3D)描述符迅速发展,并成为QSPR/QSAR分子结构表征的主流,主要有WHIM指数和CoMFA,见论文:MS-WHIM,new 3D theoretical descriptors derived from molecular surface properties:a comparative 3D QSAR study in a series of steroids.J Comput-Aided Mol Des,1997,11:79-92;Investigation of structural requirements for inhibitory activity at the rat and housefly picrotoxinin binding sites in ionotropic GABA receptors using DISCOtech and CoMFA,Chemosphere,2007,69:864-871。WHIM指数是通过不同物理量对原子空间坐标进行加权变换产生对旋转和平移不变量而得到的,计算过程相当复杂而难以得到广泛应用。而CoMFA的弊端是在进行一组分子研究时首先要对样本分子进行空间结构叠合,构象重叠,另外空间网格划分、变量数目控制及势场探针选取等过程复杂难懂、工作量大,并且有许多不确定性因素,这些都是不可忽视的问题。因此构建简便、易懂的基于化合物分子空间立体结构的三维(3D)描述符具有重要意义,但是目前还没有非常有效、简便的方法出现。
发明内容
因此,针对现有技术的上述不足,本发明目的是为QSPR/QSAR研究提供简单、易懂、有效的化合物分子结构参数化表征方法(结构描述符)。在具体应用时,选用部分已知化合物为训练集,通过该描述符对训练集样本进行结构表征,然后采用适当的数学方法(多元线性回归(MLR)、偏最小二乘回归(PLS))构建该类化合物定量结构-性质关系(QSPR/QSAR)模型,用于预测同类未知化合物某一性质(如色谱保留值、毒性、迁移特性、降解性、药效、生物活性等),为开展其它相关研究提供参考。
本发明的方法包括以下步骤:
步骤一有机化合物分子中的骨架非氢原子分类
有机化合物中的非氢原子按不同连接方式(化学键)构成分子,忽略非骨架性氢原子的影响,分子内的非氢原子依据其所连接的非氢原子数可分为A1、A2、A3、A4四类,分别表示与1、2、3、4个非氢原子相连。
步骤二给不同的非氢原子进行参数化染色
非氢原子在分子中的特征,主要由其价电子数、电子层数等因素决定,由此采用下式对不同的非氢原子进行参数化染色得到非氢原子的参数化染色值。
Zi=[mi(ni-1)(XC/Xi)1/2-hi]1/2 公式一
式中ni为非氢原子i的电子层数,mi为最外层电子数,Xi为碳原子的鲍林电负性,hi为与其直接连接的氢原子数;XC为碳原子的鲍林电负性。
步骤三通过倒数函数构建不同种类的非氢原子之间的关系
分子中非氢原子间的关系并不是原子间某种具体的作用,而是要反映其密切程度与非氢原子Zi值的改变趋势一致及与两者距离的改变趋势相反的两方面情况。通常倒数形函数可满足这一要求,采用下式进行表达不同非氢原子间的关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内江师范学院,未经内江师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710718151.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用