[发明专利]实体的排序方法、装置、介质及电子设备有效
申请号: | 201910863554.7 | 申请日: | 2019-09-12 |
公开(公告)号: | CN112487195B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 李林峰 | 申请(专利权)人: | 医渡云(北京)技术有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/216 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 排序 方法 装置 介质 电子设备 | ||
1.一种实体排序方法,其特征在于,所述方法包括:
根据M份医学数据确定关于N种主语实体的三元组,其中,每个所述三元组包含一个主语实体以及与所述主语实体具有属性关系的一个宾语实体,其中,所述主语实体为疾病名称实体,所述宾语实体为与疾病相关的特征实体;其中,M为正整数,N为大于1的整数;
统计目标三元组中目标宾语实体与所述目标三元组中目标主语实体之间的条件概率,作为第一属性;
统计所述目标宾语实体与所述N种主语实体之间的条件概率,作为中间属性;
根据所述第一属性与所述中间属性确定关于所述目标三元组的实体排序得分,包括:
计算所述第一属性与所述中间属性的比值,作为关于所述目标三元组特异性的第二属性;
根据第一次数与预设次数阈值,计算关于所述目标三元组可信度的第三属性,其中,所述第一次数为所述目标宾语实体与所述目标主语实体出现在同一份医学数据中的次数;
计算所述第一属性、所述第二属性以及所述第三属性的乘积作为所述目标三元组的实体排序得分;
其中,利用下述公式计算所述第三属性,
,
其中,为所述预设次数阈值,为所述第一次数,R为系数。
2.根据权利要求1所述的实体排序方法,其特征在于,统计目标三元组中的目标宾语实体与所述目标三元组中目标主语实体之间的条件概率,作为第一属性,包括:
统计所述目标主语实体在所述M份医学数据中出现的次数,作为第二次数;
计算所述第一次数与所述第二次数的比值作为所述第一属性。
3.根据权利要求1所述的实体排序方法,其特征在于,统计所述目标宾语实体与所述N种主语实体之间的条件概率,作为中间属性,包括:
统计所述目标宾语实体与所述N种主语实体中的任意一种出现在同一份医学数据中的次数,作为第三次数;
统计所述N种主语实体中的任意一种在所述M份医学数据中出现的次数,得到N个第四次数;
计算所述第三次数之和与所述第四次数之和的比值作为所述中间属性。
4.根据权利要求2所述的实体排序方法,其特征在于,根据所述第一属性与所述中间属性确定关于所述目标三元组的实体排序得分,包括:
统计所述目标宾语实体与所述目标主语实体同时出现,且所述目标宾语实体对应的检验结果为非正常值的医学数据的次数,作为第五次数;
计算所述第五次数与所述第一次数的比值作为第一比值;
统计所述目标宾语实体,与除所述目标主语实体之外的N-1种主语实体中的任意一种同时出现在医学数据中的次数,作为第六次数;
统计所述目标宾语实体,与除所述目标主语实体之外的N-1种主语实体中的任意一种同时出现,且所述目标宾语实体对应的检验结果为非正常值的医学数据的次数,作为第七次数;
计算所述第七次数之和与所述第六次数之和的比值作为第二比值;
将所述第一比值和所述第二比值之间的比值作为修正系数;
计算所述修正系数、所述第一属性、第二属性以及所述中间属性的乘积作为所述目标三元组的实体排序得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医渡云(北京)技术有限公司,未经医渡云(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910863554.7/1.html,转载请声明来源钻瓜专利网。