[发明专利]病历结构化方法、装置及存储介质在审
申请号: | 202210257490.8 | 申请日: | 2022-03-16 |
公开(公告)号: | CN114927180A | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 赵许盼;陶焜;高菲 | 申请(专利权)人: | 北京爱医声科技有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F16/31;G06F16/903;G06F40/154 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 董永辉;曹素云 |
地址: | 100095 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 病历 结构 方法 装置 存储 介质 | ||
本发明公开一种病历结构化方法、装置及存储介质,包括:将病历模板从根节点开始按照特征描述层级梳理直至叶子节点,形成树状结构;根据叶子节点适合填写内容,生成每个叶子节点对应的正则表达式;使用正则表达式遍历实际病历,统计叶子节点对应的正则表达式的出现次数,以及与其匹配的匹配结果,若正则表达式的出现次数和匹配结果的数量相同且都为1,则获取匹配结果和位置,将正则表达式与匹配结果保存,否则结合正则表达式逐级父节点重新组合正则表达式遍历实际病历,直至正则表达式的匹配结果的数量为1或者0,循环结束。本发明一方面可以借助病历模板的结构化信息,一方面又能获得超出模板固定限制的自由语句,可大大提高结构化的效果。
技术领域
本方法涉及自然语言处理领域,具体是提出了一种病历结构化方法、装置及存储介质,可以实现对医院文本电子病历进行关键词抽取和结构化解析,形成结构化信息表格。
背景技术
病历结构化是指将医院产生的患者电子病历(通常为自然语言描述的文本)转换成结构化的形式,从而方便计算机进行统计建模分析,用以支持临床科研、临床辅助决策、病历质控等实际应用。
病历结构化技术根据实现方式不同可以分为病历前结构化和病历后结构化。病历前结构化是指通过改进电子病历编辑器的交互方式,医生在录入电子病历过程中,在定制的病历模板录入界面下,通过点选、模板定义等输入方式,在录入病历的过程中直接将病历按信息固定结构进行输入和保存。病历前结构化技术是一种传统的结构化技术,由于直接采用了结构化的模板来限制输入内容的顺序和输入范围,生成结构化信息准确率高,但结构化录入能表示的数据维度有限,很多信息类型很难通过点选等交互形式进行录入。此外,预定义的模板数量有限,无法充分覆盖临床不同疾病不同特殊情况的病历书写需求,通用性和可扩展性弱。
病历后结构化则是利用自然语言处理技术,将医生以自然语言形式录入、存储的电子病历进行分析,解析其内在结构、并按结构顺序抽取相应信息。病历后结构化是近年来随着人工智能自然语言处理技术的兴起而发展起来的一种电子病历信息抽取技术,对原始病历录入与保存形态没有限制,后结构化对抽取的信息维度也没有限制,可以通过不断优化自然语言处理技术对医学文本的处理和理解能力来实现信息抽取广度和精度的提升。
考虑到许多医院已经有一些前结构化或近似前结构化的工作模式在被实际使用,比如一些预设的病历模板在临床上被广泛使用,医生通过复制粘贴病历模板并按患者实际病情进行修改和补充,即可快速完成病历书写。这些模板虽然在具体实施过程中医生会因为个人习惯有相应改动,但大体结构还是有的,只是医生在实际病历描述上仍个性灵活,导致病历文本不能直接结构化或结构化效果不好。
发明内容
为解决以上问题,本发明提供一种病历结构化方法,包括以下步骤:
将病历模板从根节点开始按照特征描述层级梳理直至叶子节点,从而将所述病历模板转换成树状结构;
对所述树状结构列出每个叶子节点直到根节点的父节点路径;
根据叶子节点适合填写内容,生成每个叶子节点对应的正则表达式;
使用正则表达式遍历实际病历,统计叶子节点对应的正则表达式在整个实际病历中的出现次数,并统计与该正则表达式匹配的匹配结果,若正则表达式的出现次数和匹配结果的数量相同且都为1,则获取匹配结果和位置,将正则表达式与匹配结果保存,否则从所述父节点路径中,结合正则表达式逐级父节点重新组合正则表达式遍历实际病历,直至正则表达式的出现次数以及匹配结果的数量都为1或者0,循环结束。
可选的,所述将正则表达式与匹配结果保存,是指将正则表达式与匹配结果以键值对的形式保存。
可选的,所述将病历模板从根节点开始按照特征描述层级梳理直至叶子节点,将所述病历模板转换成树状结构,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱医声科技有限公司,未经北京爱医声科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210257490.8/2.html,转载请声明来源钻瓜专利网。