[发明专利]一种超声报告后结构化解析方法、系统、设备和介质在审
申请号: | 202011418105.0 | 申请日: | 2020-12-07 |
公开(公告)号: | CN112420151A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 何国平;岳云宇;王旭英;甄化春;郭亚强;尹伟东 | 申请(专利权)人: | 医惠科技有限公司 |
主分类号: | G16H15/00 | 分类号: | G16H15/00;G16H50/30;G06F16/36;G06F40/205;G06F40/242;G06F40/247;G06F40/295;G06F40/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘晓菲 |
地址: | 310053 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 超声 报告 结构 化解 方法 系统 设备 介质 | ||
本申请公开了一种超声报告后结构化解析方法、系统及一种电子设备和计算机可读存储介质,该方法包括:获取待解析心脏超声报告文件,利用基于深度学习的命名实体识别模型识别其中的各级指标及对应的指标值;结合预先构建的心脏超声后结构化知识图谱对各级指标的准确性进行校验;若校验通过,则对各级指标及指标值进行组合,得到心脏超声后结构化数据;将心脏超声后结构化数据存入心脏超声后结构化知识图谱,以便利用更新后的知识图谱进行后结构化结果的显示。本申请预先基于深度学习训练命名实体识别模型,利用命名实体识别模型进行超声报告的识别,基于深度学习的解析方法较模板识别方法具有更好的泛化能力,能够提高识别结果的准确度和全面性。
技术领域
本申请涉及数据处理技术领域,更具体地说,涉及一种超声报告后结构化解析方法、系统及一种电子设备和一种计算机可读存储介质。
背景技术
随着现代生活水平的提高,人们越来越重视健康。而科技的进步,为各种检测技术手段提供了可能。心肌病是近年来发病率逐渐上升的疾病,心肌的增厚、心腔的扩大都要依赖彩超来判断;心脏彩超也是能直观显示瓣膜病变的仪器,通过彩超的测量,医生可了解瓣膜病变的程度以决定保守治疗还是手术治疗。因此,心脏超声报告作为重要的非结构化的临床文档具有关键作用。完整的心脏超声报告一般以非结构化数据形式进行存储,对其进行结构化处理是进一步分析和利用的基础。
目前已有的心脏超声报告的结构化处理分为两类:前结构化处理,即设计规范的病例系统,数据按照结构化直接输入,从而保证了数据的可靠性和完整性。后结构化处理,即利用自然语言处理技术对心脏超声报告数据进行结构化处理,从非结构化的病理报告中提取相关数据,得到理想的结构化输出结果。后结构化解析方法的流程通常包括:数据预处理,构建医学词库,特殊词库,自定义词库等相关词库,利用聚类、主体识别等方法提取生成模板,再利用模板进行数据抽取,实现后结构化结果的输出。
现有的心脏超声报告后结构化解析方法主要存在以下问题:医学词库,特殊词库,自定义词库的构建需要耗费大量的人力和财力,且通用性较差。而基于模板或模式识别的方法中识别结果的质量主要依赖于模板的全面性,由于不同医院病理报告的书写规范也不同,导致模板很难具备通用性和全面性,导致后结构化解析效果不佳。
因此,如何解决上述问题是本领域技术人员需要重点关注的。
发明内容
本申请的目的在于提供一种超声报告后结构化解析方法、系统及一种电子设备和一种计算机可读存储介质,能够提高识别结果的准确度和全面性。
为实现上述目的,本申请提供了一种超声报告后结构化解析方法,包括:
获取待解析心脏超声报告文件,利用基于深度学习的命名实体识别模型识别所述待解析心脏超声报告文件中的各级指标及对应的指标值;
结合预先构建的心脏超声后结构化知识图谱对识别出的所述各级指标的准确性进行校验;
若校验通过,则对所述各级指标及所述指标值对应进行组合,得到心脏超声后结构化数据;
将所述心脏超声后结构化数据存入所述心脏超声后结构化知识图谱,以便利用更新后的心脏超声后结构化知识图谱进行后结构化结果的显示。
可选的,所述心脏超声后结构化知识图谱的构建过程包括:
获取心脏超声报告文件样本,提取所述心脏超声报告文件样本中的指标信息;所述指标信息包括报告类型、各级指标以及各层级指标对应的指标值;
基于所述指标信息,创建心脏超声报告指标字典、指标同义词典、各指标之间的映射关系以及心脏超声报告后结构化知识图谱。
可选的,所述对所述各级指标及所述指标值对应进行组合,得到心脏超声后结构化数据,包括:
根据超声报告类型将所述待解析心脏超声报告文件划分为预设数量的报告类型语义块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医惠科技有限公司,未经医惠科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011418105.0/2.html,转载请声明来源钻瓜专利网。