[发明专利]一种疾病知识图谱构建方法和平台系统、设备、存储介质在审

专利信息
申请号: 201811205974.8 申请日: 2018-10-17
公开(公告)号: CN109271530A 公开(公告)日: 2019-01-25
发明(设计)人: 蒋小云 申请(专利权)人: 长沙瀚云信息科技有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06N5/02;G16H70/20
代理公司: 长沙心智力知识产权代理事务所(普通合伙) 43233 代理人: 谢如意
地址: 410006 湖南省长沙市高*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 疾病知识 存储介质 图谱构建 图谱 知识库 快速构建 平台系统 信息抽取 知识表达 知识加工 知识融合 质量评估 歧义 融合 数据源 台系统 多源 整合 抽取 数据库 标准化 规范化 加工 矛盾 学习
【说明书】:

本发明公开了一种疾病知识图谱构建方法及其系统、设备、存储介质,属于疾病知识图谱技术领域。其中,疾病知识图谱构建方法,包括以下步骤:A、信息抽取:从多源数据库中提取或学习实体、属性以及实体间的相互关系,形成本体化的知识表达;B、知识融合:对知识进行整合,以消除矛盾和歧义;C、知识加工:对于经过融合的知识,经过质量评估之后,加入到知识库中。还包括疾病知识图谱平台系统、设备和存储介质。针对现有技术中存在的问题,它从多个数据源中抽取实体、属性及其之间的关系,并进行融合、加工,可以快速构建规范化和标准化的疾病知识图谱。

技术领域

本发明涉及疾病知识图谱技术领域,尤其涉及一种疾病知识图谱构建方法及其系统、设备、存储介质。

背景技术

知识图谱的前身是语义网,它吸收了语义网、本体在知识组织和表达方面的理念,使得知识更易于在计算机之间和计算机与人之间交换、流通和加工。具体来说,一个知识图谱由模式图、数据图及两者之间的关系组成:模式图对人类知识领域的概念层面进行描述,强调概念及概念关系的形式化表达,模式图中节点是概念实体,边是概念间的语义关系,如part-of;数据图对物理世界层面进行描述,强调一系列客观事实。数据图中的节点有两类,一是模式图中的概念实体,二是描述性字符串,数据图中的边是具体事实的语义描述;模式图和数据图之间的关系指数据图的实例与模式图的概念之间的对应,或者说模式图是数据图的模具。

著名的通用知识图谱中有,谷歌“Knowledge Graph”、搜狗“知立方”、YAGO、DBpedia等,它们具有规模大、领域宽,包含大量常识等特点。目前,医学是知识图谱应用最广的垂直领域之一,如上海曙光医院构建的中医药知识图谱、本体医疗知识库SNOMED-CT,IBM Watson Health等应用近两年也开始进入人们视线。

知识图谱是智能大数据的前沿研究问题,它以独有的技术优势顺应了信息化时代的发展,比如渐增式的数据模式设计;良好的数据集成;现有RDF、OWL等标准支持;语义搜索和知识推理能力等。在医学领域,随着区域卫生信息化及医疗信息系统的发展,积累了海量的医学数据。如何从这些数据中提炼信息,并加以管理、共享及应用,是推进医学智能化的关键问题,是医学知识检索、临床诊断、医疗质量管理、电子病历及健康档案智能化处理的基础。

互联网和电子病例带来了医疗数据的爆炸性增长,然而这些数据在语种、主题、存储等方面都存在较大差异,尤其在医学领域的疾病知识图谱需要具备专业性、准确性和可应用性等条件。现有的研究成果多集中在特定数据集上,普遍存在算法准确率低、限制条件多、扩展性差等问题,同时知识复用、实体消歧等问题也有待进一步研究。由于医学自身的专业性,现有通用领域的知识图谱构建技术应用到医学领域构建成本高,需要花费大量的时间和人力投入,并且还得不到能准确刻画疾病的知识图谱。疾病知识图谱的构建相对于通用领域的知识图谱具有构建难度大、效率低,难以应用到实际场景等特点,急需适用于医学领域的知识图谱构建框架。

中国发明专利申请,公开号:CN106776711A;公开日:2017年5月31日,公开了一种基于深度学习的中文医学知识图谱构建方法。包括:从数据源获取医疗领域相关数据;使用分词工具对非结构化数据进行分词,使用RNN完成序列标注任务以识别医疗相关的实体,实现知识单元的抽取;对实体进行特征向量的构建,使用RNN进行序列标注并完成知识单元间关系的识别;进行实体对齐后,利用提取的实体以及实体之间的关系构建知识图谱。本发明巧妙地将循环神经网络用于知识单元抽取和知识单元间关系识别,能很好地完成对非结构化数据的处理。该发明提出适用于医学领域的特征来进行网络的训练任务,相对于通用特征而言更能够代表医学实体,使得抽取出的知识单元和知识单元间的关系更加准确、全面。但仍存在信息学习过程中的知识冲突问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙瀚云信息科技有限公司,未经长沙瀚云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811205974.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top