[发明专利]采用k近邻算法筛选人甲状腺素运载蛋白干扰物的方法有效
申请号: | 201910378233.8 | 申请日: | 2019-05-08 |
公开(公告)号: | CN110146695B | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 杨先海;刘会会 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G01N33/544 | 分类号: | G01N33/544;G06K9/62 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 刘海霞 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种采用k近邻算法筛选人甲状腺素运载蛋白干扰物的方法。所述方法首先针对可电离有机化学品,计算基于形态修正的量化描述符,然后采用基于形态修正的量化描述符、官能团、分子碎片描述符和k近邻算法,构建了二元分类模型和定量预测模型;筛选目标有机化学品时首先基于二元分类模型将其区分为有活性和无活性有机化学品;然后使用定量模型预测有活性的有机化学品的干扰效应数据;最后依据预测的效应值判断目标有机化学品是否为潜在的人甲状腺素运载蛋白干扰物。本发明描述符机理清晰、易于计算,预测方法易于程序化,预测模型具有较好的拟合优度、稳健性和预测能力,筛选方法可扩展性较好,适用于筛查应用域内潜在人甲状腺素运载蛋白干扰物。 | ||
搜索关键词: | 采用 近邻 算法 筛选 甲状腺素 运载 蛋白 干扰 方法 | ||
【主权项】:
1.采用k近邻算法筛选人甲状腺素运载蛋白干扰物的方法,其特征在于,具体步骤如下:(1)收集有机化学品干扰效应数据收集有机化学品的干扰效应数据,所述的干扰效应数据为有机化学品与125I‑T4或荧光探针分子竞争hTTR结合位点的能力即半数竞争效应浓度IC50;(2)计算描述符采用基于形态修正的量化描述符来表征可电离基团解离的影响:采用Gaussian 16软件优化有机化学品分子态和离子态的结构,然后基于Gaussian 16的输出文件,直接提取或计算有机化学品分子态和离子态的量化描述符,再根据式(1)计算基于形态修正的量化描述符X修正X修正=δM·XM+δI·XI (1)
,其中,XM和XI分别是有机化学品分子态和离子态的描述符值,δM和δI分别是分子态和离子态的比例分数;并采用Dragon6.0软件计算官能团和分子碎片描述符以表征有机化学品各种基团对干扰效应的影响;(3)二元分类模型的构建及表征采用收集的有机化学品的有无活性的定性数据,根据基于欧几里德距离的kNN算法构建二元分类模型,模型采用经济合作与发展组织关于模型构建与验证的导则进行表征,确定最优模型,所述的最优模型含三个描述符即形态修正的平均分子静电势Vaver‑adj、连接到sp3杂化的碳原子的氟原子F‑083和连接到sp3杂化或sp2杂化的碳原子的氢原子H‑047,邻近数k为3,所述的二元分类模型的应用域为欧几里德距离小于0.928;(4)定量预测模型的构建及表征选取采用相同测试方法和测试条件得到的定量数据,根据基于欧几里德距离的kNN算法构建定量模型,建模时用取对数的相对效应势RP表征有机化学品与125I‑T4竞争hTTR结合位点的能力,RP定义为:
,其中,IC50(T4)和IC50(有机化学品)分别代表甲状腺素和有机化学品的IC50;确定最优模型,所述的最优模型含四个描述符:Sp2杂化的取代苯碳原子数nCb‑、酚羟基数nArOH、分子内氢键数nHBonds和形态修正的平均分散度(П)Vadj,邻近数k为3;所述的定量预测模型的应用域为欧几里德距离小于1.11;(5)人甲状腺素运载蛋白干扰物的筛选①计算分类模型所需描述符,即形态修正的平均分子静电势Vaver‑adj、连接到sp3杂化的碳原子的氟原子F‑083、连接到sp3杂化或sp2杂化的碳原子的氢原子H‑047,评估目标有机化学品是否在二元分类模型应用域内;若目标有机化学品在二元分类模型应用域范围内,则根据二元分类模型计算目标有机化学品是否具有hTTR干扰活性;若目标有机化学品无活性,则不需要进一步评估;若目标有机化学品有活性,则依据定量预测模型预测其干扰效应数值大小;若目标有机化学品不在模型的应用域范围内,则不能用定量预测模型进行预测;②对于有活性的目标有机化学品,根据定量预测模型的要求计算所需描述符,即Sp2杂化的取代苯碳原子数nCb‑、酚羟基数nArOH、分子内氢键数nHBonds和形态修正的平均分散度(П)Vadj,评估其是否在定量预测模型的应用域范围内;若目标有机化学品在定量预测模型的应用域范围内,则依据选择的定量预测模型计算目标有机化学品对hTTR的logRP值;若目标有机化学品不在定量预测模型的应用域范围内,则不能用定量预测模型进行预测;③根据定量预测模型预测的logRP值判断目标有机化学品是否具有干扰hTTR转运甲状腺素的能力:若有机化学品logRP>0,则表明目标有机化学品与hTTR结合能力强于甲状腺素;若有机化学品logRP=0,则表明目标有机化学品与hTTR结合能力与甲状腺素相近;若有机化学品logRP<0,则表明目标有机化学品与hTTR结合能力弱于甲状腺素。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910378233.8/,转载请声明来源钻瓜专利网。