[发明专利]一种用于药物-靶点相互作用数据的清洗方法和装置在审
申请号: | 202210929570.3 | 申请日: | 2022-08-03 |
公开(公告)号: | CN115171795A | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 焦阳;吴俊峰;潘麓蓉 | 申请(专利权)人: | 慧壹科技(上海)有限公司;香港圆壹智慧有限公司;美国圆壹智慧科技有限公司 |
主分类号: | G16B50/30 | 分类号: | G16B50/30;G16B15/30;G16B40/00 |
代理公司: | 北京清大紫荆知识产权代理有限公司 11718 | 代理人: | 黄贞君;黎飞鸿 |
地址: | 201316 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 药物 相互作用 数据 清洗 方法 装置 | ||
本发明提供一种用于药物‑靶点相互作用数据的清洗方法,包括如下步骤:提供原始的药物‑靶点相互作用数据集合;对所述原始的药物‑靶点相互作用数据集合根据预定的清洗规则进行筛选过滤,获得待研究的药物‑靶点相互作用数据集合;其中,所述预定的清洗规则基于图的邻接矩阵的数据结构。本发明还提供用于药物‑靶点相互作用数据的清洗系统。本发明提供一种对药物靶点蛋白的结构、功能等进行恰当描述和比较从而使得靶点蛋白的差异可以被量化的方法和系统。
技术领域
本发明属于人工智能辅助药物研发领域,尤其涉及一种数据驱动的和基于机器学习、人工智能的药物分子设计、药物-靶点相互作用构效关系评估研究、药物大数据集的构建和整理等。
背景技术
当前领域内存在大量公开的或私有的药物-靶点相互作用数据,但直接混用这些数据进行建模和训练,进行预测新的潜在药物疗效等的尝试,往往受挫于靶点蛋白和相应药物分子化学空间的差异性。不同类型的靶点在构效关系上可能存在不同,甚至完全相反的机制,导致模型过拟合或泛化能力不足,预测全新靶点模型性能表现差等问题。
基于以上,本申请提供了解决以上技术问题的技术方案。
发明内容
本发明的第一目的在于获得一种用于药物-靶点相互作用数据的清洗方法,对药物靶点蛋白的结构、功能等进行恰当描述和比较从而使得靶点蛋白的差异可以被量化。
本发明的第二目的在于获得一种用于药物-靶点相互作用数据的清洗系统,对药物靶点蛋白的结构、功能等进行恰当描述和比较从而使得靶点蛋白的差异可以被量化。
本发明的第一方面提供一种用于药物-靶点相互作用数据的清洗方法,包括如下步骤:
提供原始的药物-靶点相互作用数据集合;
对所述原始的药物-靶点相互作用数据集合根据预定的清洗规则进行筛选过滤,获得待研究的药物-靶点相互作用数据集合;
其中,所述预定的清洗规则基于图的邻接矩阵的数据结构。
在本发明的一个优选的实施方式中,所述预定的清洗规则包括:
步骤1:构建通用的数据结构;
步骤2:选取所述通用的数据结构中的子集数据结构,所述子集数据结构包括所述原始的药物-靶点相互作用数据集合的数据结构;
步骤3:将所述步骤2的子集数据结构转化为基于所述图的邻接矩阵的数据结构;
步骤4:基于所述图的邻接矩阵的数据结构完成数据清洗。
在本发明的一个优选的实施方式中,所述预定的清洗规则还包括,基于所述图的邻接矩阵的数据结构,进行逻辑关系的补完或距离计算。
在本发明的一个优选的实施方式中,所述数据结构中,所述图的邻接矩阵的存储方式采用按行记录的稀疏矩阵。
在本发明的一个优选的实施方式中,所述图的邻接矩阵的数据结构中,使得在同一个所述图的邻接矩阵中存储多种关系。
在本发明的一个优选的实施方式中,所述图的邻接矩阵的数据结构中,采用二进制转为整数值的flag值的方式存储,使得在同一个所述图的邻接矩阵中存储多种关系。
在本发明的一个优选的实施方式中,所得到的待研究的药物-靶点相互作用数据集合用于模型训练。
在本发明的一个具体实施方式中,所得到的待研究的药物-靶点相互作用数据集合可提高模型的精度。
在一个具体实施方式中,所述数据加工装置将所得到的待研究的药物-靶点相互作用数据集合进行加工,以用于对药物-靶点相互作用的预测。
本发明的第二方面提供一种用于药物-靶点相互作用数据的清洗装置,其包括:
数据提供单元,设置为提供原始的药物-靶点相互作用数据集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧壹科技(上海)有限公司;香港圆壹智慧有限公司;美国圆壹智慧科技有限公司,未经慧壹科技(上海)有限公司;香港圆壹智慧有限公司;美国圆壹智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210929570.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能行走辅助装置
- 下一篇:测试方法、装置、设备、介质
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置