[发明专利]一种医疗知识图谱的构建系统和构建方法有效
申请号: | 201910334418.9 | 申请日: | 2019-04-24 |
公开(公告)号: | CN110111905B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 史亚飞 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G16H70/20 | 分类号: | G16H70/20;G16H50/70;G06F16/901;G06F16/36 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 医疗 知识 图谱 构建 系统 方法 | ||
1.一种医疗知识图谱的构建系统,其特征在于:
所述医疗知识图谱的构建系统包括实体识别处理模块、融合处理模块、关系强度指标计算模块、相关关系构建模块和存储模块;其中,
所述实体识别处理模块用于对医学病历执行实体识别处理,以此得到实体;
所述融合处理模块用于对所述实体执行异构数据融合处理,以此得到医疗知识图谱实体;
所述关系强度指标计算模块用于计算所述医疗知识图谱实体中不同实体之间的关系强度指标;
所述相关关系构建模块用于构建不同所述医疗知识图谱实体中不同实体之间的相关关系;
所述存储模块用于将医疗知识图谱实体和所述相关关系保存至图数据库中;
所述关系强度指标计算模块,还包括:通过归一化谷歌距离算法NGD计算关系强度指标NGD(E1,E2)是通过下面公式(1)实现,
(1);
通过优化的点互信息算法PMI计算关系强度指标PMI(E1,E2)是通过下面公式(2)实现,
(2);
计算最终关系强度指标P(E1,E2)是通过下面公式(3)和(4)实现,
(3)
(4)
其中,在上述公式(1)-(4)中,N为病历信息中第一实体E1与第二实体E2共现的总数量,N(E1,E2)为第一实体E1与第二实体E2之间的共现数量,N(E1)为病历信息中第一实体E1的数量,N(E2)为病历信息中第二实体E2的数量,max为取较大值运算函数符号,min为取较小值运算函数符号。
2.如权利要求1所述的医疗知识图谱的构建系统,其特征在于:
所述实体识别处理模块包括命名实体识别处理子模块和实体生成子模块;其中,
所述命名实体识别处理子模块用于通过自然语言识别模型对所述医学病历中的病历信息执行命名实体识别处理;
所述实体生成子模块用于将所述命名实体识别处理得到的所述病历信息中对应的疾病相关数据、症状相关数据或者检查相关数据中的至少一者,作为所述实体。
3.如权利要求1所述的医疗知识图谱的构建系统,其特征在于:
所述融合处理模块包括数据清洗处理子模块、实体消歧处理子模块、实体对齐处理子模块;其中,
所述数据清洗处理子模块用于对所述异构数据中的疾病相关数据、症状相关数据或者检查相关数据中的至少一者进行数据清洗处理;
所述实体消歧处理子模块用于对所述异构数据中的疾病相关数据、症状相关数据或者检查相关数据中的至少一者进行实体消歧处理;
所述实体对齐处理子模块用于对所述异构数据中的疾病相关数据、症状相关数据或者检查相关数据中的至少一者进行实体对齐处理。
4.如权利要求1所述的医疗知识图谱的构建系统,其特征在于:
所述关系强度指标计算模块包括数据预处理子模块和数据过滤子模块;
所述数据预处理子模块用于对所述异构数据中任意的第一实体E1和第二实体E2形成的实体对进行预处理,以此获取所述第一实体E1与所述第二实体E2之间的共现数量N(E1,E2);
所述数据过滤子模块用于将所述共现数量N(E1,E2)与预设共现数量阈值TN进行比较,并且,
若N(E1,E2)TN,则所述数据过滤子模块剔除当前共现数量对应的第一实体E1与第二实体E2,
否则,所述数据过滤子模块保留当前共现数量对应的第一实体E1与第二实体E2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910334418.9/1.html,转载请声明来源钻瓜专利网。