[发明专利]药物设计中配体分子海量特征筛选方法有效
申请号: | 201710015626.3 | 申请日: | 2017-02-17 |
公开(公告)号: | CN106778032B | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 吴建盛;张邱鸣;胡海峰 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G16C20/50 | 分类号: | G16C20/50;G16C20/70 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 李湘群 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了药物设计中配体分子海量特征筛选方法。在基于配体的药物分子虚拟筛选中,由于配体分子数量巨大,使用目前最流行的ECFP方法产生的配体分子指纹特征的维数(每一维特征表示一个子结构)将会是海量的,甚至可达上千万维,在实际任务中会陷入“维数灾难”问题。本方法将使用基于EDPP准则的LASSO方法,对配体分子海量的ECFP分子指纹特征进行筛选,利用鲁棒性选择方法得到配体分子相关特征。配体分子的活性通常与少数子结构有关,本方法将快速并大幅去除不相关特征,选择鲁棒的相关特征,解决“维数灾难”问题,得到与配体活性相关的子结构,推动ECFP方法在药物设计中更广泛的应用。 | ||
搜索关键词: | 药物 设计 中配体 分子 海量 特征 筛选 方法 | ||
【主权项】:
1.药物设计中配体分子海量特征筛选方法,其特征在于,所述方法包括如下步骤:步骤1:配体分子扩展连接性指纹ECFP特征生成;给定初始数据集其中是每个分子的原子连接图,Yi是每个样本的标记,对初始数据集进行处理,得到最终描述样本的ECFP特征,处理过的数据集Dt={(Xi,Yi)|Xi∈R1*m,1≤i≤n};步骤2:基于加强对偶多面体投影准则EDPP的最小绝对收缩选择算子LASSO方法的配体分子特征筛选,对处理过的数据集Dt,应用EDPP准则,对于满足条件的λ={λi|0≤i<K,λi>λi+1},得到对应于λ的特征筛选结果Τ={Τi|Τi∈R1*m,0≤i<K};Τi每一位的值为1代表特征保留,0代表特征已删除,对于K个特征筛选结果,统计每一位特征的频数,然后降序排序,选取排名前p个的特征作为最终的特征筛选结果;步骤3:基于鲁棒性选择方法的配体分子特征选择。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710015626.3/,转载请声明来源钻瓜专利网。