[发明专利]一种面向中文电子病历文本结构化解析的标注方法有效
申请号: | 201811363466.2 | 申请日: | 2018-11-16 |
公开(公告)号: | CN109524071B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 翟运开;赵杰;陈保站;刘志飘;陈昊天;石金铭;卢耀恩;曹明波 | 申请(专利权)人: | 郑州大学第一附属医院 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G16H50/70;G06F16/36;G06F16/34;G06F40/289;G06F40/295 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 刘松 |
地址: | 450001 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向中文电子病历文本结构化解析的标注方法,属于大数据技术领域,建立标注系统,参与标注的人员通过Web页面对入院记录标注原始表进行中文分词、词性和命名实体标注,并生成标注结果表,解决了对电子病历文本的分词、词性、命名实体标进行简洁的标注的技术问题,本发明同时站在标注者和算法设计人员的视角,一方面标注系统简洁易用,最大限度降低标注者的标注工作强度,降低出错率,另一方面,标注系统设计与知识库管理系统、核心算法系统实现数据流无缝对接,即原始电子病历数据经过预处理后直接流入标注系统,标注系统的输出直接作为核心算法系统的输入。 | ||
搜索关键词: | 一种 面向 中文 电子 病历 文本 结构 化解 标注 方法 | ||
【主权项】:
1.一种面向中文电子病历文本结构化解析的标注方法,其特征在于:包括如下步骤:步骤1:建立标注系统,标注系统包括标注系统架构和标注数据库;标注系统架构包括Web开发框架和标注功能接口;步骤2:Web开发框架采用Spring MVC Web开发架构,具体执行步骤如下:步骤S1:首先用户发送请求信息至前端控制器,前端控制器根据请求信息来决定选择哪一个页面控制器进行处理。并把请求信息委托给该页面控制器;步骤S2:页面控制器接收到请求信息后进行功能处理:首先需要收集和绑定请求信息到一个对象,设定该对象在Spring Web MVC中叫命令对象,并进行验证,然后将命令对象委托给业务对象进行处理;最后处理完毕后返回一个Model And View,即,模型数据和逻辑视图名;步骤S3:前端控制器收回控制权,然后根据返回的逻辑视图名,选择相应的视图进行渲染,并把模型数据传入以便视图渲染;步骤S4:前端控制器再次收回控制权,将响应返回给用户;步骤3:标注功能接口全部遵循Restful标准化接口规范,接口规范采用标准的HTTP规范方法,并遵循HTTP规范方法中的语义;步骤4:用户通过Web页面将入院记录标注原始表输入标注系统,标注数据库读取并存储入院记录标注原始表;步骤5:参与标注的人员通过Web页面对入院记录标注原始表进行中文分词、词性和命名实体标注,并生成标注结果表,其具体步骤如下:步骤A1:中文分词标注:参与标注的人员登录Web页面后进入中文分词标注功能页面,加载入院记录标注原始表,采用BEMS标记法进行分词标注;所有标注信息暂存为临时变量,直到参与标注的人员在Web页面上确认标记完毕后,标注系统架构调用后台的Restful标注保存接口,将数据写入中文分词标注表的分词标注结果字段,加BMES标记处理后写入分词标注结果字段,生成中文分词标注结果表;中文分词标注接口包括分词标注加载接口和修改保存接口;分词标注加载接口用于从标注原始表读取原始标注文本或从分词标注结果表中读取标注中间结果集;修改保存接口用于保存修改后的入院记录标注原始表中文分词标注结果;步骤A2:词性标注:参与标注的人员登录Web页面后进入词性标注功能页面,加载入院记录标注原始表,参与标注的人员基于分词结果逐个对分词的词性进行选择确认,词性的标注信息暂存为临时变量,直到参与标注的人员在Web页面上确认标注结束后,标注系统架构调用后台的Restful标注保存接口,将数据写入词性标注表的标注结果字段,生成词性标注结果表;词性标注接口包括词性标注加载接口和修改保存接口;词性标注加载接口用于从词性标注结果表中读取词性标注中间结果集;修改保存接口用于保存修改后的入院记录标注原始表分词词性标注结果;步骤A3:命名实体标注:参与标注的人员登录Web页面后进入命名实体标注功能页面,加载入院记录标注原始表,参与标注的人员在Web页面上对基于定义的命名实体类型进行识别与类型匹配,标注信息暂存为临时变量,直到参与标注的人员在Web页面上确认标注完成,标注系统架构调用后台的Restful标注保存接口,将数据写入命名实体标注表的命名实体标注结果字段,加命名实体标签处理后写入标注结果字段,生成命名实体标注结果表;命名实体标注接口包括命名实体标注加载接口和修改保存接口;命名实体标注加载接口用于从标注原始表读取原始标注文本或从命名实体标注结果表中读取标注中间结果集;修改保存接口用于保存修改后的入院记录标注原始表命名实体标注结果;步骤6:标注系统架构将中文分词标注结果表、词性标注结果表和命名实体标注结果表打包后作为标注结果表,标注数据库存储标注结果表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学第一附属医院,未经郑州大学第一附属医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811363466.2/,转载请声明来源钻瓜专利网。