[发明专利]实体的排序方法、装置、介质及电子设备有效
申请号: | 201910863554.7 | 申请日: | 2019-09-12 |
公开(公告)号: | CN112487195B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 李林峰 | 申请(专利权)人: | 医渡云(北京)技术有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/216 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 排序 方法 装置 介质 电子设备 | ||
本公开提供了一种实体的排序方法、装置、计算机可读介质及电子设备,涉及医学数据处理技术领域。该方法包括:根据M份医学数据确定关于N种主语实体的三元组,其中,每个三元组包含一个主语实体以及与主语实体具有属性关系的一个宾语实体;统计目标三元组中的目标宾语实体与目标三元组中目标主语实体之间的条件概率,作为第一属性;统计目标宾语实体与N种主语实体之间的条件概率,作为中间属性;根据第一属性与中间属性确定关于目标三元组的实体排序得分。本技术方案能够提升实体排序的准确度,进一步地,有利于提升医学知识图谱对医学知识的表述准确度。
背景技术
医学知识图谱技术是能够使得计算机算法系统理解医学知识的关键技术。示例性的,计算机算法系统就可以基于医学知识图谱技术实现辅助诊疗、病历质控、智能导诊、自动化核保等多种医学任务。
医学知识中,一种疾病实体可能有多种症状实体,一种疾病实体可能也可能对应多种药物实体。因此,应在构建医学知识图谱中的实体进行排序(ranking),通过排序得分确定实体之间的关联关系。进而,基于实体之间的关联关系构建的医学知识图谱才能够直接应用于临床决策支持系统(Clinical Decision Support System,CDSS)中的症状推荐、检查拓建以及用药推荐等。
相关技术中,一般采用实体的共现频次(co-occurrence number)或者频率(probability)来实现实体排序。或者,还可以采用词频-逆文本频率指数(TermFrequency-Inverse Document Frequency,简称:TF-IDF)来实现实体排序。
然而,相关技术提供的实体排序的准确度较低,导致医学知识图谱对医学知识的表述准确度下降。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例的目的在于提供一种实体的排序方法、实体的排序装置、计算机可读介质及电子设备,进而至少在一定程度上提升实体排序的准确度,有利于提升医学知识图谱对医学知识的表述准确度。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的第一方面,提供了一种实体的排序方法,包括:
根据M份医学数据确定关于N种主语实体的三元组,其中,每个上述三元组包含一个主语实体以及与上述主语实体具有属性关系的一个宾语实体;
统计目标三元组中的目标宾语实体与上述目标三元组中目标主语实体之间的条件概率,作为第一属性;
统计上述目标宾语实体与上述N种主语实体之间的条件概率,作为中间属性;
根据上述第一属性与上述中间属性确定关于上述目标三元组的实体排序得分,其中,M为正整数,N为大于1的整数。
在本公开的一种实施例中,基于前述方案,统计目标三元组中的目标宾语实体与上述目标三元组中目标主语实体之间的条件概率,作为第一属性,包括:
统计上述目标宾语实体与上述目标主语实体出现在同一份医学数据中的次数,作为第一次数;
统计上述目标主语实体在上述M份医学数据中出现的次数,作为第二次数;
计算上述第一次数与上述第二次数的比值作为上述第一属性。
在本公开的一种实施例中,基于前述方案,统计上述目标宾语实体与上述N种主语实体之间的条件概率,作为中间属性,包括:
统计上述目标宾语实体与上述N种主语实体中的任意一种出现在同一份医学数据中的次数,作为第三次数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医渡云(北京)技术有限公司,未经医渡云(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910863554.7/2.html,转载请声明来源钻瓜专利网。