[发明专利]专病知识图谱构建方法及装置、介质及电子设备有效
申请号: | 202011578688.3 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112507138B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 韩朝 | 申请(专利权)人: | 医渡云(北京)技术有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G16H10/60;G06F40/295 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 构建 方法 装置 介质 电子设备 | ||
1.一种专病知识图谱构建方法,其特征在于,包括:
获取专病标准数据,并基于所述专病标准数据构建针对预设指标的标准知识图谱;
获取针对所述预设指标的待处理专病数据,并对所述待处理专病数据进行值域统计,以获取所述待处理专病数据对应的待处理统计数据;
将所述待处理统计数据和所述标准知识图谱融合,得到针对预设指标的专病知识图谱;
其中,所述将所述待处理统计数据和所述标准知识图谱融合,包括:
根据所述待处理统计数据在所述标准知识图谱包含的标准字段值节点中确定冗余字段值节点,并将所述冗余字段值节点移除得到中间知识图谱;
基于所述待处理统计数据对所述中间知识图谱中各中间字段值节点进行属性关联。
2.根据权利要求1所述的方法,其特征在于,所述待处理统计数据包括在所述待处理专病数据中确定所述预设指标对应的至少一个待处理字段值的数量分布数据;
所述根据所述待处理统计数据在所述标准知识图谱包含的标准字段值节点中确定冗余字段值节点,包括:
根据所述待处理字段值的数量分布数据统计所述标准知识图谱中各标准字段值节点对应的第一数量;
在所述标准字段值节点对应的第一数量为0时,确定所述标准字段值节点为冗余字段值节点。
3.根据权利要求1所述的方法,其特征在于,所述待处理统计数据包括在所述待处理专病数据中确定所述预设指标对应的至少一个待处理字段值的数量分布数据;
所述基于所述待处理统计数据对所述中间知识图谱中各中间字段值节点进行属性关联,包括:
根据所述待处理字段值的数量分布数据统计所述中间知识图谱中各中间字段值节点对应的第二数量;
将各所述中间字段值节点对应的第二数量作为属性,分别与所述中间知识图谱中的各所述中间字段值节点进行关联。
4.根据权利要求1所述的方法,其特征在于,所述获取针对所述预设指标的待处理专病数据,包括:
获取待处理原始患者数据,并在所述待处理原始患者数据中提取预设指标对应的原始字段值;
对所述原始字段值进行归一化,输出归一字段值;
基于所述原始字段值和归一字段值生成待处理专病数据。
5.根据权利要求4所述的方法,其特征在于,在所述对所述原始字段值进行归一化处理之前,所述方法还包括:
根据正则关系库对所述原始字段值进行矫正,以获取矫正后的原始字段值。
6.根据权利要求4所述的方法,其特征在于,所述对所述原始字段值进行归一化处理,包括:
根据归一词表对所述原始字段值进行归一化处理。
7.根据权利要求6所述的方法,其特征在于,在所述根据归一词表对所述原始字段值进行归一化处理之后,所述方法还包括:
根据归一配置文件对所述原始字段值进行归一化处理。
8.根据权利要求1所述的方法,其特征在于,所述获取专病标准数据,包括:
对数据源中的标准数据进行领域划分,得到至少一个领域数据集;
对所述至少一个领域数据集进行实体识别和关系识别;
基于所述实体识别和所述关系识别的识别结果在所述至少一个领域数据集抽取目标专病数据,并将抽取的所述目标专病数据确定为专病标准数据。
9.根据权利要求1所述的方法,其特征在于,所述基于所述专病标准数据构建针对预设指标的标准知识图谱,包括:
在所述专病标准数据中获取与所述预设指标存在关系数据的实体数据;
以所述实体数据为标准字段值节点,以所述关系数据为连接信息构建针对预设指标的标准知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医渡云(北京)技术有限公司,未经医渡云(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011578688.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种漏洞扫描系统
- 下一篇:一种电池包双输入的充电电路