[发明专利]一种基于DNA编码化合物数据库的系统及其分析方法在审
申请号: | 201811394303.0 | 申请日: | 2018-11-21 |
公开(公告)号: | CN110021366A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 郑明月;陆晓杰;刘小红;蒋华良;李召军 | 申请(专利权)人: | 中国科学院上海药物研究所 |
主分类号: | G16B50/00 | 分类号: | G16B50/00;G16B30/10 |
代理公司: | 北京金信知识产权代理有限公司 11225 | 代理人: | 刘锋;戎骏京 |
地址: | 201203 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构效关系 化合物数据库 测序 解码 存储模块 解码模块 实体库 存储实体 解码文件 配置文件 实体数据 数据分析 存储 分析 筛选 | ||
1.一种基于DNA编码化合物数据库的系统,其特征在于,包括实体库模块、测序模块、解码模块和构效关系存储模块;
所述实体库模块用于存储实体数据;
所述测序模块用于筛选所述实体数据并对其测序,生成DNA编码文件;
所述解码模块用于定义配置文件,解码所述DNA编码文件,生成解码文件并生成构效关系;
所述构效关系存储模块用于存储所述构效关系。
2.如权利要求1所述的基于DNA编码化合物数据库的系统,其特征在于,还包括解码文件存储模块和计算模块;
所述解码文件存储模块用于存储DNA编码文件及所述配置文件;
所述计算模块用于将所述DNA编码文件与所述配置文件中的序列匹配并计数,生成匹配结果和解码文件。
3.如权利要求1所述的基于DNA编码化合物数据库的系统,其特征在于,还包括聚类模块和排序模块;
所述聚类模块用于将所述解码文件的数据按照每个循环分别聚类,并将原先的DNA编码的化合物结构片段组合抽象为化合物结构类型组合;
所述排序模块用于对所述化合物结构类型组合排序,分别对所述结构类型组合中的类内结构片段排序。
4.如权利要求1所述的基于DNA编码化合物数据库的系统,其特征在于,还包括虚拟库模块,所述虚拟库模块用于存储虚拟库数据。
5.如权利要求4所述的基于DNA编码化合物数据库的系统,其特征在于,还包括字符串定义模块、反应规则定义模块及组装模块;
所述字符串定义模块用于根据所述实体库中的数据片段定义所述数据片段反应位点的字符串;
所述反应规则定义模块用于根据所述字符串定义相对应的反应规则;
所述组装模块用于根据所述反应规则,组装所述数据片段。
6.一种基于DNA编码化合物数据库的分析方法,其特征在于,
对实体库中的数据进行筛选和测序,生成DNA编码文件;
对所述DNA编码文件进行解码,生成解码文件;
分析所述解码文件,生成构效关系。
7.如权利要求6所述的基于DNA编码化合物数据库的分析方法,其特征在于,对所述DNA编码文件进行解码,生成解码文件具体为:
定义配置文件,将DNA编码文件与所述配置文件中的序列匹配并计数;
输出匹配结果,并分类写出错误文件;
写出解码文件。
8.如权利要求6所述的基于DNA编码化合物数据库的分析方法,其特征在于,分析所述解码文件,生成构效关系具体为:
将所述解码文件的数据按照每个循环分别聚类,并将原先DNA编码的化合物结构片段组合抽象为化合物结构类型组合并排序;
分别对所述化合物结构类型组合中的类内结构片段排序,并生成构效关系。
9.一种虚拟库的建立方法,包括实体库和虚拟库,其特征在于,
根据所述实体库中的数据片段定义所述数据片段反应位点的字符串;
根据所述字符串定义相对应的反应规则;
根据所述反应规则,组装所述数据片段;
导入所述数据片段,得到所述虚拟库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海药物研究所,未经中国科学院上海药物研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811394303.0/1.html,转载请声明来源钻瓜专利网。