[发明专利]基于知识图谱的老药新用分析方法和系统在审
申请号: | 202010921211.4 | 申请日: | 2020-09-04 |
公开(公告)号: | CN112131399A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 牛张明;郑双佳;饶家华;宋颖 | 申请(专利权)人: | 牛张明;韦德·门佩斯-史密斯 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N20/00;G16H20/10;G16H50/70 |
代理公司: | 上海智晟知识产权代理事务所(特殊普通合伙) 31313 | 代理人: | 张东梅 |
地址: | 浙江省杭州市钱塘*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 老药新用 分析 方法 系统 | ||
本发明公开了一种基于知识图谱的老药新用分析方法,包括:获取知识图谱;提取知识图谱中所有疾病实体、药物实体、基因实体以及疾病实体、药物实体、基因实体之间的关系;将所有实体和关系向量化,得到每个实体的特征向量和关系的特征向量;确定一个或多个候选机器学习模型;对候选机器学习模型进行训练;对候选机器学习模型进行验证并比较,挑选出最优机器学习模型;应用最优模型针对特定疾病进行预测,获得多个与该特定疾病相关的药物实体。
技术领域
本发明涉及化学信息学和生物信息学领域。具体而言,本发明涉及基于知识图谱的老药新用分析方法和系统。
背景技术
生物医学知识图谱通常是一个多关系的有向图,其中结点代表实体,边代表关系,这种图结构的知识库已经成为具有巨大价值的资源,具有潜在的应用价值,有助于精确医学和临床决策支持,在医疗保健实践和研究中起着越来越重要的作用。但是,由于生物医学数据构建的知识图谱通常庞大且嘈杂以及下游任务的复杂性和高知识要求,在构建和应用方面仍然存在许多挑战。
实体间链接预测任务,是目前生物医疗知识图谱应用最为广泛的一个下游任务,可用于多个领域的分析研究,如通过药物与疾病的链接预测可以研究制药领域中老药新用的问题。尽管生物医疗知识图谱的出现为这些研究课题提供了一种新的研究数据,但是由于生物医学数据构建的知识图谱通常庞大且嘈杂,难以有效地学习知识图谱中所蕴含的大量信息,包括低阶或高阶的邻居信息以及有向的关系信息,因此这些下游任务的实验效果往往不尽人意,未能达到预期的效果。
因此,近年来研究人员一直致力于如何充分有效地学习知识图谱所蕴含的大量知识,提升知识图谱下游任务的实验效果,以得到预期的实验效果。而随着深度学习方法的出现,机器学习越来越受到研究人员的关注,数据驱动分析已成为许多研究的常规程序。在许多这样的研究应用中,虽然机器学习方法在生物医学知识图谱应用中的使用仍然受到实体的特征属性缺乏的限制,但依然显示出了其与传统方法竞争甚至超越传统方法的强大潜力。
当前计算机领域对于知识图谱的应用已经相当广泛,常见于搜索引擎、推荐系统,问答系统,而其中最为重要的技术则是知识表示学习,通过以深度学习为代表的学习技术,将实体的信息表示为稠密低维的实值向量,进而在低维空间中高效计算实体、关系及其之间的复杂关联,通常有基于翻译模型(Trans系列)的知识表示学习,基于矩阵分解模型的知识表示学习,例如RESACL,以及基于神经网络的模型的知识表示学习。这些知识表示学习方法,都是通过一定的建模方法,将实体和向量表示在低维稠密向量空间中,然后进行计算和推理。因此,尽管它们已经成功应用于生物医学领域之外的问题解答,信息提取和命名实体歧义消除等知识图谱的任务上,但它们在生物医学知识图谱应用中的使用仍然缺乏实验验证。
发明内容
为解决上述问题,本发明采用利用公开的任意的知识图谱数据集,利用背景知识为所有疾病、药物和基因实体提供具有生物化学意义的特征属性,训练得到一个有效的最优的图嵌入学习模型,充分学习知识图谱中实体间的高阶或低阶的邻居信息以及有向的关系信息,并利用该模型对特定的疾病进行老药新用的预测,得到分数最高的排名前十的可能存在关系的药物,并通过大量的文献证明了该预测结果是有效的和可靠的,为老药新用在知识图谱中的研究提供了一种切实有效的新的分析方法和技术。
本发明的实施例利用图嵌入方法对生物医疗知识图谱中老药新用下游任务的探索。本发明的方法适用于任意知识图谱,可通过该方法技术利用任意的知识图谱数据集研究某些疾病的老药新用效果,可达到预期的实验结果。
根据本发明的一个方面,提供一种基于知识图谱的老药新用分析方法,包括:
获取知识图谱;
提取知识图谱中所有疾病实体、药物实体、基因实体以及疾病实体、药物实体、基因实体之间的关系;
将所有实体和关系向量化,得到每个实体的特征向量和关系的特征向量;
确定一个或多个候选机器学习模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于牛张明;韦德·门佩斯-史密斯,未经牛张明;韦德·门佩斯-史密斯许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010921211.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型扩散泵冷却装置
- 下一篇:提高连铸板栅与铅膏连接可靠性的方法