[发明专利]医疗数据结构化处理方法、装置及设备在审
申请号: | 202111098493.3 | 申请日: | 2021-09-18 |
公开(公告)号: | CN113823371A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 龚快快;孙铭权;付相钞 | 申请(专利权)人: | 上海保链科技有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F40/289;G06F40/242;G06F16/835 |
代理公司: | 苏州京昀知识产权代理事务所(普通合伙) 32570 | 代理人: | 段晓玲;顾友 |
地址: | 201802 上海市嘉定区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 数据结构 处理 方法 装置 设备 | ||
1.一种医疗数据结构化处理方法,其特征在于,包括:
利用预设规则引擎根据对应的预设规则对待处理数据进行解析,获取半结构化的中间数据;
利用分词工具基于预先构建的基库对所述半结构化的中间数据进行分词处理,获取分词结果,所述预先构建的基库包括疾病基库、手术基库、药品基库、诊疗基库以及材料基库中的一个或多个;
采用预设模型根据与所述分词结果中每一分词对应的标注规则分别对所述每一分词进行序列标注,生成结构化的目标数据。
2.根据权利要求1所述的医疗数据结构化处理方法,其特征在于,所述预设规则引擎包括根据java代码和groovy编写的规则引擎。
3.根据权利要求1或2所述的医疗数据结构化处理方法,其特征在于,所述利用预设规则引擎根据对应的预设规则对待处理数据进行解析,获取半结构化的中间数据包括:
对所述待处理数据进行预处理;
获取需要解析的字段及字段规则,根据所述字段规则从预处理后的所述待处理数据中获取所述字段对应的值,生成键值对格式的半结构化的中间数据。
4.根据权利要求1所述的医疗数据结构化处理方法,其特征在于,所述预先构建的基库包括多个层级及多类信息。
5.根据权利要求1所述的医疗数据结构化处理方法,其特征在于,所述分词工具包括jieba分词工具。
6.根据权利要求1所述的医疗数据结构化处理方法,其特征在于,所述分词结果包括每一分词对应的词性,所述采用预设模型根据与所述分词结果中每一分词对应的标注规则分别对所述每一分词进行序列标注,生成结构化的目标数据包括:
确定所述分词结果中每一分词对应的标注规则;
根据对应的所述标注规则以及所述词性对每一分词进行序列标注,生成结构化的目标数据。
7.根据权利要求1所述的医疗数据结构化处理方法,其特征在于,所述预设模型包括隐马尔科夫模型、结构化感知机和条件随机场中的一种或几种。
8.一种医疗数据结构化处理装置,其特征在于,包括:
解析模块,用于利用预设规则引擎根据对应的预设规则对待处理数据进行解析,获取半结构化的中间数据;
分词模块,与所述解析模块连接,用于利用分词工具基于预先构建的基库对所述半结构化的中间数据进行分词处理,获取分词结果,所述预先构建的基库包括疾病基库、手术基库、药品基库、诊疗基库以及材料基库中的一个或多个;
标注模块,与所述分词模块连接,用于采用预设模型根据与所述分词结果中每一分词对应的标注规则分别对所述每一分词进行序列标注,生成结构化的目标数据。
9.一种医疗数据结构化处理设备,其特征在于,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,当所述计算机程序被所述处理器执行时,实现权利要求1~7中任一项所述的医疗数据结构化处理方法。
10.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,其特征在于,所述计算机程序被执行时,实现权利要求1~7中任一项所述的医疗数据结构化处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海保链科技有限公司,未经上海保链科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111098493.3/1.html,转载请声明来源钻瓜专利网。