[发明专利]一种病历文本中患者基本信息的检查方法及系统在审
申请号: | 202110132076.X | 申请日: | 2021-01-31 |
公开(公告)号: | CN112800767A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 李雪;沈洁;刘升平;梁家恩 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G16H10/60 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 病历 文本 患者 基本信息 检查 方法 系统 | ||
本发明涉及一种病历文本中患者基本信息的检查方法及系统,该方法包括:步骤1、利用文本抽取,从病历首页获取患者的第一基本信息实体,以及病历中描述患者病情的病历描述文本;步骤2、根据所述第一基本信息实体,从所述病历描述文本中抽取第二基本信息实体;步骤3、根据标准基本信息对所述第一基本信息实体和所述第二基本信息实体进行检查。本发明利用文本抽取和比对的方式,能够自动化完成对病历文本中患者基本信息的检查,大大提高了检查效率和检查质量。
技术领域
本发明涉及文本处理领域,具体涉及一种病历文本中患者基本信息的检查方法及系统。
背景技术
一份病历中,除了病案首页填写患者的基本信息外,查房记录,病程记录等文书中会多次描述患者的基本信息(姓名、性别、年龄等),其中可能会存在书写错误的文书,目前是采用人工校验核对的方式,工作量大、效率低且容易出现漏检的情况。
发明内容
本发明提供一种病历文本中患者基本信息的检查方法及系统,能够解决现有人工检查方式存在的上述技术问题。
本发明解决上述技术问题的技术方案如下:
第一方面,本发明提供一种病历文本中患者基本信息的检查方法,包括:
步骤1、利用文本抽取,从病历首页获取患者的第一基本信息实体,以及病历中描述患者病情的病历描述文本;
步骤2、根据所述第一基本信息实体,从所述病历描述文本中抽取第二基本信息实体;
步骤3、根据标准基本信息对所述第一基本信息实体和所述第二基本信息实体进行检查。
本发明的有益效果是:利用文本抽取和比对的方式,能够自动化完成对病历文本中患者基本信息的检查,大大提高了检查效率和检查质量。
进一步,步骤2具体包括:
步骤2.1、利用所述第一基本信息实体对所述病历描述文本进行回标,得到粗标数据;
步骤2.2、利用预先构建的规则集对所述粗标数据进行规则修正和增强,得到修正数据;
步骤2.3、采用预训练语言模型在所述修正数据上进行微调,得到预测结果;
步骤2.4、根据所述预测结果,完善所述规则集;
重复执行步骤2.2-步骤2.4,直到所述预训练语言模型的预测效果不再提升。
上述进一步方案的有益效果是,利用规则集能够有效识别标注错误的数据,并利用预训练语言模型强大的信息表征能力和泛化能力,可以显著提升信息抽取的有效性。
进一步,步骤2.1中,在利用所述第一基本信息实体对所述病历描述文本进行回标之前,还包括对所述病历描述文本进行清洗的步骤。
上述进一步方案的有益效果是,通过对文本进行清洗,能够减少文本中的无用信息。
进一步,所述预训练语言模型采用BERT+CRF。
进一步,步骤3具体包括:
比较标准基本信息与所述第一基本信息实体和第二基本信息实体,若不能完全匹配,则生成基本信息填写错误的提示信息。
第二方面,本发明提供一种病历文本中患者基本信息的检查系统,包括:
第一抽取模块,用于利用文本抽取,从病历首页获取患者的第一基本信息实体,以及病历中描述患者病情的病历描述文本;
第二抽取模块,用于根据所述第一基本信息实体,从所述病历描述文本中抽取第二基本信息实体;
检查模块,用于根据标准基本信息对所述第一基本信息实体和所述第二基本信息实体进行检查。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110132076.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加速AI模型部署的方法和设备
- 下一篇:一种可变形吸盘的控制方法