[发明专利]解决医疗数据标准编码对照问题的映射处理系统及方法有效
申请号: | 201410374349.1 | 申请日: | 2014-07-31 |
公开(公告)号: | CN104156415B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 李轶强;马国耀;蔡军;孙勇韬;肖华 | 申请(专利权)人: | 沈阳锐易特软件技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 沈阳东大知识产权代理有限公司21109 | 代理人: | 朱光林 |
地址: | 110179 辽宁省沈*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解决 医疗 数据 标准 编码 对照 问题 映射 处理 系统 方法 | ||
1.一种解决医疗数据标准编码对照问题的映射处理系统,其特征在于:包括:资源词库、目标值域库、模拟语义分词单元、模糊匹配单元、精确匹配单元、匹配表和人工管理单元;
资源词库:存储有基础词汇和医疗专业词汇;
目标值域库:用于存储标准码,即GB/T或医疗行业规范定义的编码值;
模拟语义分词单元:包括分词模块、词库加载模块、词元处理模块、相似度评估模块和分析模块;
所述分词模块用于采用最细粒度分词方式或智能分词方式对数据源提供的数据信息进行语义分解和分词切分处理;
所述词库加载模块用于实现字典加载管理,对资源词库信息进行加载,将资源词库中的基础词汇和医疗专业词汇加载到缓存中,为词元处理模块提供词元信息;
所述词元处理模块对词库加载模块提供的词元信息进行缓存,对中文词汇、数量词汇、字母词汇进行分类处理,并为分析模块提供词元支撑;
所述相似度评估模块用于对分类处理后数据的相似度评估,得到相似度评估结果;
所述分析模块用于对调度分词模块、相似度评估模块、词元处理模块进行协调调度,并将相似度评估结果作为模拟语义分词结果输出至模糊匹配单元;
模糊匹配单元:包括语法分析模块、索引创建模块、索引存储模块、索引库、索引搜索模块、相关性排序模块和匹配优化模块;
模糊匹配单元用于根据目标值域库信息对模拟语义分词处理结果进行模糊匹配处理;
所述语法分析模块用于对模拟语义分词结果进行语法分析和语言处理形成若干词;
所述索引创建模块用于根据语法分析模块形成的若干词生成词典索引和反向索引;
所述索引存储模块用于根据词典索引和反向索引对形成的若干词进行关联后存储到索引库中;
所述索引库用于存储词典索引和反向索引;
所述索引搜索模块用于将索引库中的词典索引和反向索引载入到内存,利用查询树搜索索引,得到每个词对应的数据源信息链表,对该信息链表进行布尔运算后获得数据源信息的具体指向位置,从而得到索引搜索结果;
所述相关性排序模块用于计算索引搜索结果与源词库中的医疗专业词汇的相关度并进行排序;
所述匹配优化模块用于根据相关度阈值来选取资源词库中的医疗专业词汇与数据源信息链的最佳匹配关联关系,并经过人工校验后将该最佳匹配关联关系作为模糊匹配结果存储至匹配表中;
精确匹配单元:包括数据获取模块和精确匹配模块;
所述数据获取模块用于获取数据源提供的数据信息;
所述精确匹配模块用于根据数据获取模块获取的数据源提供的数据信息与目标值域库存储的标准码或者匹配表存储的映射匹配规则信息进行精确匹配映射,生成数据映射匹配结果,即精确匹配结果;
所述匹配表用于存储映射匹配规则信息,映射匹配规则信息即数据源的数据信息与目标值域库间的匹配关联关系;
人工管理单元:用于对资源词库、目标值域库与匹配表进行调整。
2.采用权利要求1所述的解决医疗数据标准编码对照问题的映射处理系统的医疗数据映射处理方法,其特征在于:包括以下步骤:
步骤1:从医疗数据源获取数据,根据目标值域库存储的标准码或匹配表存储的存储映射匹配规则信息,对获取的数据进行精确匹配映射:若获取的数据与匹配表存储的映射匹配规则信息完全匹配,则执行步骤4;否则,执行步骤2;
步骤2:对从数据源获取的数据进行模糊语义分析;
步骤2-1:通过对资源词库信息进行加载,将资源词库中的基础词汇和医疗专业词汇加载到缓存中,为词元处理提供词元信息;
步骤2-2:采用最细粒度分词方式或智能分词方式对数据源提供的数据信息进行分词处理,包括语义分解和分词切分处理;
步骤2-3:进行词元处理:对资源词库中的基础词汇和医疗专业词汇进行缓存,对中文词汇、数量词汇、字母词汇进行分类处理;
步骤2-4:对加载的词元信息与分词处理后的数据进行相似度评估,得到相似度评估结果;
步骤2-5:将相似度评估结果作为模拟语义分词结果;
步骤3:对模拟语义分词结果进行模糊匹配处理,并生成映射匹配结果;
步骤3-1:对模拟语义分词结果进行语法分析和语言处理形成若干词;
步骤3-2:根据形成的若干词生成词典索引和反向索引;
步骤3-3:根据词典索引和反向索引对形成的若干词进行关联后存储到索引库中;
步骤3-4:将索引库中的词典索引和反向索引载入到内存,利用查询树搜索索引,得到每个词对应的数据源信息链表,对该信息链表进行布尔运算后获得数据源信息的具体指向位置,从而得到索引搜索结果;
步骤3-5:计算各索引搜索结果与目标值域库中的标准码之间的关联度,并对各关联度进行排序;
步骤3-6:人工设定关联度阈值,对符合关联度阈值的索引搜索结果进行人工校验,并建立匹配关联关系,该匹配关联关系作为映射匹配规则信息存储至匹配表中;
步骤4:根据匹配表中的映射匹配规则信息将医疗数据映射成标准码,生成医疗数据映射处理结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳锐易特软件技术有限公司,未经沈阳锐易特软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410374349.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置