[发明专利]一种自动化的国际疾病分类编码方法及系统有效

专利信息
申请号: 201510496513.0 申请日: 2015-08-13
公开(公告)号: CN105069124B 公开(公告)日: 2018-06-15
发明(设计)人: 金以东;朱华玲;陈志永 申请(专利权)人: 易保互联医疗信息科技(北京)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京三友知识产权代理有限公司 11127 代理人: 汤在彦
地址: 100027 北京市朝*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明的实施方式提供了一种自动化的国际疾病分类编码方法。该方法包括:输入中文疾病诊断信息;对中文疾病诊断信息进行自然语言处理,得到一个或多个待编码名称;基于标准术语库和扩充术语库,查找与待编码名称相匹配的标准术语或扩充术语,并将匹配成功的标准术语或扩充术语的编码,确定为待编码名称的编码;其中,标准术语是所要参考的ICD版本中包含的各个疾病术语,扩充术语是标准术语的俗称、别称或缩略语,或标准术语的子类疾病术语,或新产生的疾病术语。通过本发明上述实施方式的方法,可以自动完成ICD编码,无需人工参与,具有编码速度高、成本低、正确率高等优点。此外,本发明的实施方式还提供了一种自动化的国际疾病分类编码系统。 1
搜索关键词: 标准术语 国际疾病分类编码 疾病诊断信息 自动化 疾病 自然语言处理 匹配成功 人工参与 输入中文 自动完成 术语库 正确率 子类 匹配 查找 参考 中文
【主权项】:
1.一种自动化的国际疾病分类编码方法,包括:

步骤1,输入中文疾病诊断信息;

步骤2,对所述中文疾病诊断信息进行自然语言处理,得到一个或多个待编码名称;

步骤3,基于标准术语库和扩充术语库,查找与所述待编码名称相匹配的标准术语或扩充术语,并将匹配成功的标准术语或扩充术语的编码,确定为所述待编码名称的编码;

其中,所述标准术语库按照如下方式创建:

确定所要参考的国际疾病分类ICD版本;

将所述所要参考的国际疾病分类ICD版本中包含的各个疾病术语,确定为标准术语;

根据所述所要参考的国际疾病分类ICD版本,确定每一个标准术语的编码;

存储所述标准术语及其编码,得到标准术语库;

其中,所述扩充术语库按照如下方式创建:

将未包含于所述所要参考的国际疾病分类ICD版本中的以下各种类型确定为扩充术语:所述标准术语的俗称\别称\缩略语,所述标准术语的子类疾病术语,以及在所述所要参考的国际疾病分类ICD版本公布之后新产生的疾病术语;

当所述扩充术语为任意一个所述标准术语的俗称\别称\缩略语时,将该标准术语的编码赋予该扩充术语;

当所述扩充术语为任意一个所述标准术语的子类疾病术语或所述新产生的疾病术语时,将与该扩充术语的属种关系最接近的标准术语的编码赋予该扩充术语;

存储所述扩充术语及其编码,得到扩充术语库;

其中,所述步骤2包括:

步骤21,对所述中文疾病诊断信息字符串进行预处理,得到预处理后的中文疾病诊断信息字符串;

步骤22,基于预先建立的本体词典、疾病程度术语词典、疾病并发术语词典、发病部位术语词典,将所述预处理后的中文疾病诊断信息字符串切分成若干第一类型子字符串和/或第二类型子字符串;

其中,所述本体词典包括所述标准术语库和所述扩充术语库,所述标准术语和所述扩充术语均为本体;

所述疾病程度术语词典包括若干疾病程度术语,所述疾病程度术语是用于描述疾病急慢性程度或疾病严重程度或病理类型或临床分期的词语;

所述疾病并发术语词典包括若干疾病并发术语,所述疾病并发术语是用于描述至少两种疾病并发出现的词语;

所述发病部位术语词典包括若干发病部位术语,所述发病部位术语是用于描述疾病发病部位的词语;

所述第一类型子字符串能够与所述本体词典中的本体直接匹配,所述第二类型子字符串不能够与所述本体词典中的本体直接匹配;

步骤23,将切分出的第一类型子字符串和第二类型子字符串确定为待编码名称;

其中,所述步骤21包括:

对所述中文疾病诊断信息字符串中的非汉字进行格式归一化处理,并删除所述中文疾病诊断信息字符串中的非医学术语,得到预处理后的中文疾病诊断信息字符串,其中所述非医学术语由一预先建立的非医学术语词典提供,且所述非医学术语为起备注作用的词语;

其中,所述步骤22包括:

判断所述预处理后的中文疾病诊断信息字符串是否包含符号;

如果所述预处理后的中文疾病诊断信息字符串包含符号,则将所述预处理后的中文疾病诊断信息字符串中每相邻两个符号之间的字符作为整体与本体词典中的本体进行匹配;若匹配成功,则将该相邻两个符号之间的字符切分出来作为第一类型子字符串;若匹配失败,则将该相邻两个符号及其之间的字符确定为暂不切分字符串,并判断所述暂不切分字符串中是否包含预设的特殊符号;

若所述暂不切分字符串中包含特殊符号,则查找所述暂不切分字符串所属的字符模型,并根据该所属的字符模型对应的切分规则对所述暂不切分字符串进行切分,将切分出来的字符与本体词典中的本体进行匹配,若匹配成功,则将该切分出来的字符作为第一类型子字符串,若匹配失败,则将该切分出来的字符作为第二类型子字符串;其中,所述字符模型由一预先建立的字符模型库提供,且所述字符模型具有一一对应的切分规则;

若所述暂不切分字符串中不包含特殊符号,则将所述暂不切分字符串直接确定为第二类型子字符串;

如果所述预处理后的中文疾病诊断信息字符串未包含符号,则采用机械分词法将所述预处理后的中文疾病诊断信息字符串中的单个字符或多个连续的字符与所述本体词典中的本体进行匹配;

若所述预处理后的中文疾病诊断信息字符串中的所有字符均能够与本体匹配,则依据所匹配的本体将所述预处理后的中文疾病诊断信息字符串中的单个字符或多个连续的字符切分出来作为第一类型子字符串;

若所述预处理后的中文疾病诊断信息字符串中存在未能与本体匹配的单个字符或多个连续的字符,则判断所述未能与本体匹配的单个字符或多个连续的字符是否为疾病程度术语、疾病并发术语或发病部位术语;

当所述未能与本体匹配的单个字符或多个连续的字符为疾病程度术语、疾病并发术语或发病部位术语时,根据所述未能与本体匹配的单个字符或多个连续的字符在所述预处理后的中文疾病诊断信息字符串中的位置,将所述未能与本体匹配的单个字符或多个连续的字符与其之前或之后能够与本体匹配的单个字符或多个连续的字符合并切分出来作为第二类型子字符串,并将所述预处理后的中文疾病诊断信息字符串中其余的能够与本体匹配的单个字符或多个连续的字符切分出来作为第一类型子字符串;

当所述未能与本体匹配的单个字符或多个连续的字符不为疾病程度术语、疾病并发术语或发病部位术语时,将所述预处理后的中文疾病诊断信息字符串整体切分出来作为第二类型子字符串。

2.根据权利要求1所述的自动化的国际疾病分类编码方法,其中,

所述步骤3还包括:基于假定分类术语库,查找与所述待编码名称相匹配的假定分类术语;将匹配成功的假定分类术语的编码,确定为所述待编码名称的编码;

其中,所述假定分类术语库按照如下方式创建:

将未包含于所述所要参考的国际疾病分类ICD版本中、且与任意一个所述标准术语相关、且临床上默认等同于该标准术语、且并非该标准术语的俗称\别称\缩略语的疾病术语,确定为假定分类术语;

将与所述假定分类术语相关的该标准术语的编码,赋予所述假定分类术语;

存储所述假定分类术语及其编码,得到假定分类术语库。

3.根据权利要求1所述的自动化的国际疾病分类编码方法,其中,

所述步骤3还包括:基于多编码术语库,查找与所述待编码名称相匹配的多编码术语;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易保互联医疗信息科技(北京)有限公司,未经易保互联医疗信息科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510496513.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

tel code back_top