[发明专利]解决医疗数据标准编码对照问题的映射处理系统及方法有效
申请号: | 201410374349.1 | 申请日: | 2014-07-31 |
公开(公告)号: | CN104156415B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 李轶强;马国耀;蔡军;孙勇韬;肖华 | 申请(专利权)人: | 沈阳锐易特软件技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 沈阳东大知识产权代理有限公司21109 | 代理人: | 朱光林 |
地址: | 110179 辽宁省沈*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解决 医疗 数据 标准 编码 对照 问题 映射 处理 系统 方法 | ||
技术领域
本发明涉及数据处理技术领域,具体涉及一种解决医疗数据标准编码对照问题的映射处理系统及方法。
背景技术
在医疗数据的使用过程中,通常需要对数据值域内容进行匹配处理,将医疗数据值根据标准要求映射成其它值,即基于标准编码的映射处理。通常,该处理过程需要根据实际业务情况来进行手工配置,手工配置方式匹配效率低、匹配错误率高、工作量大,在实际业务数据匹配构建过程中无法根据实际情况进行快速构建。因此,需要一种可以实现高效、简便的映射处理方法来解决数据编码的标准化对照问题,可以基于已有的编码规则来快速实现数据编码标准化映射,而无需手工重新对照映射。
发明内容
针对现有技术存在的问题,本发明提供一种解决医疗数据标准编码对照问题的映射处理系统及方法。
本发明的技术方案是:
解决医疗数据标准编码对照问题的映射处理系统,包括:资源词库、目标值域库、模拟语义分词单元、模糊匹配单元、精确匹配单元、匹配表和人工管理单元;
资源词库:存储有基础词汇和医疗专业词汇;
目标值域库:用于存储标准码,即GB/T或医疗行业规范定义的编码值;
模拟语义分词单元:包括分词模块、词库加载模块、词元处理模块、相似度评估模块和分析模块;
所述分词模块用于采用最细粒度分词方式或智能分词方式对数据源提供的数据信息进行语义分解和分词切分处理;
所述词库加载模块用于实现字典加载管理,对资源词库信息进行加载,将资源词库中的基础词汇和医疗专业词汇加载到缓存中,为词元处理模块提供词元信息;
所述词元处理模块对词库加载模块提供的词元信息进行缓存,对中文词汇、数量词汇、字母词汇进行分类处理,并为分析模块提供词元支撑;
所述相似度评估模块用于对分类处理后数据的相似度评估,得到相似度评估结果;
所述分析模块用于对调度分词模块、相似度评估模块、词元处理模块进行协调调度,并 将相似度评估结果作为模拟语义分词结果输出至模糊匹配单元;
模糊匹配单元:包括语法分析模块、索引创建模块、索引存储模块、索引库、索引搜索模块、相关性排序模块和匹配优化模块;
模糊匹配单元用于根据目标值域库信息对模拟语义分词处理结果进行模糊匹配处理;
所述语法分析模块用于对模拟语义分词结果进行语法分析和语言处理形成若干词;
所述索引创建模块用于根据语法分析模块形成的若干词生成词典索引和反向索引;
所述索引存储模块用于根据词典索引和反向索引对形成的若干词进行关联后存储到索引库中;
所述索引库用于存储词典索引和反向索引;
所述索引搜索模块用于将索引库中的词典索引和反向索引载入到内存,利用查询树搜索索引,得到每个词对应的数据源信息链表,对该信息链表进行布尔运算后获得数据源信息的具体指向位置,从而得到索引搜索结果;
所述相关性排序模块用于计算索引搜索结果与源词库中的医疗专业词汇的相关度并进行排序;
所述匹配优化模块用于根据相关度阈值来选取资源词库中的医疗专业词汇与数据源信息链的最佳匹配关联关系,并经过人工校验后将该最佳匹配关联关系作为模糊匹配结果存储至匹配表中;
精确匹配单元:包括数据获取模块和精确匹配模块;
所述数据获取模块用于获取数据源提供的数据信息;
所述精确匹配模块用于根据数据获取模块获取的数据源提供的数据信息与目标值域库存储的标准码或者匹配表存储的映射匹配规则信息进行精确匹配映射,生成数据映射匹配结果,即精确匹配结果;
所述匹配表用于存储映射匹配规则信息,映射匹配规则信息即数据源的数据信息与目标值域库间的匹配关联关系;
人工管理单元:用于对资源词库、目标值域库与匹配表进行调整。
采用所述的解决医疗数据标准编码对照问题的映射处理系统的医疗数据映射处理方法,包括以下步骤:
步骤1:从医疗数据源获取数据,根据目标值域表存储的标准码或匹配表存储的存储映射匹配规则信息,对获取的数据进行精确匹配映射:若获取的数据与匹配表存储的映射匹配规则信息完全匹配,则执行步骤4;否则,执行步骤2;
步骤2:对从数据源获取的数据进行模糊语义分析;
步骤2-1:通过对资源词库信息进行加载,将资源词库中的基础词汇和医疗专业词汇加载到缓存中,为词元处理提供词元信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳锐易特软件技术有限公司,未经沈阳锐易特软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410374349.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置