[发明专利]知识图谱构建方法、装置、存储介质及电子设备有效
申请号: | 201811601675.6 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109670054B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 王尧;李林峰 | 申请(专利权)人: | 医渡云(北京)技术有限公司;金色熊猫有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G16H70/00 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 袁礼君;阚梓瑄 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 构建 方法 装置 存储 介质 电子设备 | ||
本公开是关于一种知识图谱构建方法、装置、存储介质和电子设备,属于医疗大数据技术领域。该方法包括:将病历数据处理为包括多个实体以及所述多个实体的类型的关系对数据,所述多个实体包括起始实体和终止实体;计算所述关系对数据的词频,并根据所述关系对数据中的所述起始实体和所述终止实体计算所述终止实体的基本逆文档频率;根据所述词频、所述基本逆文档频率以及权重计算模型确定所述关系对数据的关系权重,以根据所述关系权重构建医学知识图谱。本公开能够准确计算实体组成的关系对数据的关系权重,从而准确构建医学知识图谱。
技术领域
本公开涉及医疗大数据技术领域,具体而言,涉及一种知识图谱构建方法、知识图谱构建装置、计算机可读存储介质以及电子设备。
背景技术
知识图谱可以用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系,在信息检索和信息整合等领域扮演着越来越重要的角色,可以为用户提供更广度、更深度的知识体系。
在医学领域中建立知识图谱时,需要计算医疗实体之间关联关系的权重。相关技术中,使用某项疾病的病历中终止实体出现的总次数以及某项疾病的病历总数目的比值来计算权重。或者是使用某一个医疗关键词计算权重,而不考虑与该医疗关键词存在关联关系的其他医疗关键词。
在上述第一种方式中,利用比值计算时对于常用辅助药物而言,可能常用辅助药物与每种疾病强关联,准确性较差,且不符合医学常识。第二种方式中,基本逆文档频率的计算只考虑一个医疗关键词。若某一类疾病数据占比较大,当出现该疾病的典型症状时,由第二种方式得到该疾病与典型症状之间的权重较小,导致数据挖掘结果与实际情况差别较大,准确率较低。另外,由于权重计算公式固定,不能适用于不同场景,其应用效果无法得到最优,因此灵活性较差,且计算结果不准确。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种知识图谱构建方法、知识图谱构建装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的医疗实体之间的关系权重计算不准确等问题。
根据本公开的一个方面,提供一种知识图谱构建方法,包括:将病历数据处理为包括多个实体以及所述多个实体的类型的关系对数据,所述多个实体包括起始实体和终止实体;计算所述关系对数据的词频,并根据所述关系对数据中的所述起始实体和所述终止实体计算所述终止实体的基本逆文档频率;根据所述词频、所述基本逆文档频率以及权重计算模型确定所述关系对数据的关系权重,以根据所述关系权重构建医学知识图谱。
在本公开的一种示例性实施例中,计算所述关系对数据的词频包括:确定包括所述起始实体且与所述终止实体的类型对应的所有实体组成的关系对数据的出现次数;根据所述关系对数据的出现次数以及所有实体组成的关系对数据的出现次数的比值,计算所述关系对数据的所述词频。
在本公开的一种示例性实施例中,根据所述关系对数据中的起始实体和终止实体计算所述终止实体的基本逆文档频率包括:确定与所述终止实体相关的起始实体的类别数量;确定属于所述起始实体的类型的所有实体的类别数量;根据所述起始实体的类别数量以及所述所有实体的类别数量计算所述终止实体的所述基本逆文档频率。
在本公开的一种示例性实施例中,根据所述词频、所述基本逆文档频率以及权重计算模型确定所述关系对数据的关系权重包括:将所述词频和所述基本逆文档频率输入所述权重计算模型,以得到所述关系对数据中的实体之间的关系权重,所述权重计算模型为人工设定模型或训练好的机器学习模型。
在本公开的一种示例性实施例中,所述方法还包括:通过预设数据集对机器学习模型进行训练,得到所述训练好的机器学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医渡云(北京)技术有限公司;金色熊猫有限公司,未经医渡云(北京)技术有限公司;金色熊猫有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811601675.6/2.html,转载请声明来源钻瓜专利网。