[发明专利]一种基于有机化合物分子三维结构计算的结构描述符在审
申请号: | 201710718151.4 | 申请日: | 2017-08-21 |
公开(公告)号: | CN107516012A | 公开(公告)日: | 2017-12-26 |
发明(设计)人: | 廖立敏;李建凤 | 申请(专利权)人: | 内江师范学院 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 泰州地益专利事务所32108 | 代理人: | 谭建成 |
地址: | 641100 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于有机化合物分子三维立体结构计算的结构描述符,属于化合物定量结构‑性质关系研究方法技术领域。目的是通过选用部分已知化合物为训练集,采用该描述符对训练集样本进行结构表征,然后运用适当的数学方法(多元线性回归(MLR)、偏最小二乘回归(PLS))构建该类化合物结构‑性质关系(QSPR/QSAR)模型,用于模拟预测同类未知化合物某一性质。方法包括以下步骤步骤一 有机化合物分子中的骨架非氢原子分类;步骤二 给不同的非氢原子进行参数化染色;步骤三 通过倒数函数构建不同种类的非氢原子之间的关系;步骤四 将有机化合物分子结构进行优化到能量最低状态,获取非氢原子的空间坐标,运用程序计算得到结构描述符。通过建立化合物结构描述符与某种性质之间的关系模型,可以较准确地模拟预测同类有机化合物的性质,对于有机化合物的QSPR/QSAR研究具有很高的参考价值。 | ||
搜索关键词: | 一种 基于 有机化合物 分子 三维 结构 计算 描述 | ||
【主权项】:
一种基于有机化合物分子三维结构计算的结构描述符,其特征在于,所述方法包括以下步骤:步骤一 有机化合物分子中的骨架非氢原子分类有机化合物中非氢原子按不同连接方式(化学键)构成分子,忽略非骨架性氢原子的影响,分子内的非氢原子依据其所连接的非氢原子数可分为A1、A2、A3、A4四类,分别表示与1、2、3、4个非氢原子相连。步骤二 给不同的非氢原子进行参数化染色非氢原子在分子中的特征,主要由其价电子数、电子层数等因素决定,由此采用下式对不同的非氢原子进行参数化染色得到非氢原子的参数化染色值。Zi=[mi(ni‑1)(XC/Xi)1/2‑hi]1/2 公式一式中ni为非氢原子i的电子层数,mi为最外层电子数,Xi为碳原子的鲍林电负性,hi为与其直接连接的氢原子数;XC为碳原子的鲍林电负性。步骤三 通过倒数函数构建不同种类的非氢原子之间的关系分子中非氢原子间的关系并不是原子间某种具体的相互作用,而是要反映其密切程度与非氢原子Zi值的改变趋势一致及与两者距离的改变趋势相反的两方面情况。通常倒数形函数可满足这一要求,采用下式进行表达不同非氢原子间的关系。rij是分子中非氢原子i、j的相对距离(即两者间空间距离与碳碳单键键长值之比表示);n和l为非氢原子所属类型。化合物分子中4类非氢原子可以产生出10种不同关系项:m11、m12、m13、m14、m22、m23、m24、m33、m34、m44,其中m12表示分子中第一类非氢原子与第二类非氢原子之间的关系,同理m23表示分子中第二类非氢原子与第三类非氢原子之间的关系,以此类推。10种不同关系项分别记为x1、x2、x3、x4、x5、x6、x7、x8、x9和x10,这样对于研究样本最多将产生10个与分子结构相关的结构描述符。步骤四 将有机化合物分子结构进行优化到能量最低状态,获取非氢原子的空间坐标,运用程序计算得到结构描述符。使用ChemOffice 8.0构建有机化合物分子的初始立体结构,用Chem 3D自带的MOPAC半经验量子化学软件在AM1水平上最终优化得到分子结构(截断值0.001kJ·mol‑1),并得到每个原子的空间位置坐标。将分子中每个原子的空间位置坐标及参数化染色值输入自编的C语言应用程序加以处理,得到分子结构描述符。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内江师范学院,未经内江师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710718151.4/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用