[发明专利]一种基于机器学习预测化合物人体屏障通透性的方法在审
申请号: | 202210005174.1 | 申请日: | 2022-01-05 |
公开(公告)号: | CN114360660A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 庄树林;高雨晨;赵启明;苟艺源;张家晨 | 申请(专利权)人: | 浙江大学 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G06N20/00 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 预测 化合物 人体 屏障 通透 方法 | ||
1.一种基于机器学习预测化合物人体屏障通透性的方法,其特征在于,所述的人体屏障通透性为血脑屏障通透性,包括以下步骤:
(1)建立化合物血脑屏障通透性评价标准;
(2)采集化合物建立B3DataBase数据集,清洗数据集后根据步骤(1)建立的标准评价数据集中的样本是否具有血脑屏障通透性,将评价结果作为样本标签;导出样本的SMILES表达式后提取样本的特异性分子特征作为样本数据,对样本数据进行预处理;
(3)基于机器学习算法构建预测模型,利用预处理后的样本数据对预测模型在样本标签的监督下进行训练,以优化预测模型参数;所述的机器学习算法为多层感知机网络;
(4)导出待测化合物的SMILES表达式后提取待测化合物的特异性分子特征,作为待测数据输入至参数优化的预测模型中,预测待测化合物的血脑屏障通透性。
2.根据权利要求1所述的基于机器学习预测化合物人体屏障通透性的方法,其特征在于,步骤(1)中,所述的化合物血脑屏障通透性标准为:当logBB>-1时,表示该化合物具有血脑屏障通透性;当logBB≤-1时,表示该化合物不具有血脑屏障通透性;其中,
logBB=Cblood/Cbrain
logBB为脑血分配系数,Cblood为血液中化合物浓度,Cbrain为脑组织中化合物浓度。
3.根据权利要求1所述的基于机器学习预测化合物人体屏障通透性的方法,其特征在于,步骤(2)中,化合物采集于文献实验数据或化合物数据库。
4.根据权利要求1所述的基于机器学习预测化合物人体屏障通透性的方法,其特征在于,清洗数据集的步骤为:对B3DataBase数据集去除重复分子、中性分子、盐类以及含有重金属的分子;对于拥有超过1个logBB值的样本:如果logBB值有2个,则取加权平均值;如果logBB值多于2个,则选取出现频率最高的logBB值。
5.根据权利要求1所述的基于机器学习预测化合物人体屏障通透性的方法,其特征在于,所述的特异性分子特征包括分子描述符和\或一种或多种分子指纹。
6.根据权利要求1所述的基于机器学习预测化合物人体屏障通透性的方法,其特征在于,步骤(3)中,将预处理后的样本数据划分为训练集和测试集,利用训练集训练所述的预测模型,利用测试集评价预测模型优度,优化预测模型参数。
7.根据权利要求1所述的基于机器学习预测化合物人体屏障通透性的方法,其特征在于,所述的多层感知机网络包括输入层、隐藏层和输出层,所述的隐藏层为1层,神经元节点数为75个。
8.根据权利要求7所述的基于机器学习预测化合物人体屏障通透性的方法,其特征在于,隐藏层的传递函数为relu激活函数,adam算法作为权重优化路径。
9.根据权利要求1-8任一所述的基于机器学习预测化合物人体屏障通透性的方法在预测化合物血脑屏障通透性中的应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210005174.1/1.html,转载请声明来源钻瓜专利网。