[发明专利]一种中文手术操作信息的自动编码方法及系统有效
申请号: | 201510496500.3 | 申请日: | 2015-08-13 |
公开(公告)号: | CN105069123B | 公开(公告)日: | 2018-06-26 |
发明(设计)人: | 金以东;陈志永;朱华玲 | 申请(专利权)人: | 易保互联医疗信息科技(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 汤在彦 |
地址: | 100027 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的实施方式提供了一种中文手术操作信息的自动编码方法及系统,该方法包括:对输入的中文手术操作信息进行自然语言处理,得到待编码名称;查找与待编码名称相匹配的标准术语或扩充术语,并将匹配成功的标准术语或扩充术语的编码,确定为待编码名称的编码;标准术语是国际疾病分类ICD中规定的手术操作名称,标准术语的编码是国际疾病分类ICD中规定的相应手术操作名称的编码;扩充术语是与标准术语具有同义关系的词语或具有属种关系的词语;扩充术语与具有同义关系或属种关系的标准术语对应的编码一致。本发明可自动、快速、准确地识别出手术操作名称并对其编码,整个过程无需人工参与,具有编码速度快、成本低、准确率高等优点。 | ||
搜索关键词: | 标准术语 手术操作 国际疾病分类 同义关系 自动编码 中文 词语 过程无需人工 自然语言处理 匹配成功 准确率 匹配 查找 | ||
【主权项】:
1.一种中文手术操作信息的自动编码方法,包括:步骤1,输入中文手术操作信息;步骤2,对所述中文手术操作信息进行自然语言处理,得到一个或多个待编码名称;步骤3,基于预先建立的标准术语库和扩充术语库,查找与所述待编码名称相匹配的标准术语或扩充术语,并将匹配成功的标准术语或扩充术语的编码,确定为所述待编码名称的编码;其中,所述标准术语库包括若干标准术语及其编码,所述标准术语是国际疾病分类ICD中规定的手术操作名称,所述标准术语的编码是国际疾病分类ICD中规定的相应手术操作名称的编码;所述扩充术语库包括若干扩充术语及其编码,所述扩充术语是与所述标准术语具有同义关系的词语或具有属种关系的词语;所述扩充术语与具有同义关系或属种关系的所述标准术语对应的编码一致;所述步骤2包括:步骤21,对所述中文手术操作信息字符串进行预处理,得到预处理后的中文手术操作信息字符串;步骤22,基于预先建立的本体词典、方位词典、等级词典,将所述预处理后的中文手术操作信息字符串切分成若干第一类型子字符串和/或第二类型子字符串;其中,所述本体词典包括所述标准术语库和扩充术语库,所述标准术语和所述扩充术语均为本体;所述方位词典包括若干方位术语,所述方位术语是用于描述手术操作所针对的方位的词语;所述等级词典包括若干等级术语,所述等级术语是用于描述手术操作的级别、类型的词语;所述第一类型子字符串能够与所述本体词典中的本体直接匹配,所述第二类型子字符串不能够与所述本体词典中的本体直接匹配;步骤23,将切分出的第一类型子字符串和第二类型子字符串确定为待编码名称;所述步骤21包括:对所述中文手术操作信息字符串中的非汉字进行格式归一化处理,并删除所述中文手术操作信息字符串中的非医学术语,得到预处理后的中文手术操作信息字符串,其中所述非医学术语由一预先建立的非医学术语词典提供,且所述非医学术语为起备注作用的词语、短语或句子;所述步骤22包括:判断所述预处理后的中文手术操作信息字符串是否包含符号;如果所述预处理后的中文手术操作信息字符串包含符号,则将所述预处理后的中文手术操作信息字符串中每相邻两个符号之间的字符作为整体与本体词典中的本体进行匹配;若匹配成功,则将该相邻两个符号之间的字符切分出来作为第一类型子字符串;若匹配失败,则将该相邻两个符号及其之间的字符确定为暂不切分字符串,并判断所述暂不切分字符串中是否包含预设的特殊符号;若所述暂不切分字符串中包含特殊符号,则查找所述暂不切分字符串所属的字符模型,并根据该所属的字符模型对应的切分规则对所述暂不切分字符串进行切分,将切分出来的字符与本体词典中的本体进行匹配,若匹配成功,则将该切分出来的字符作为第一类型子字符串,若匹配失败,则将该切分出来的字符作为第二类型子字符串;其中,所述字符模型由一预先建立的字符模型库提供,且所述字符模型具有一一对应的切分规则;若所述暂不切分字符串中不包含特殊符号,则将所述暂不切分字符串直接确定为第二类型子字符串;如果所述预处理后的中文手术操作信息字符串未包含符号,则采用机械分词法将所述预处理后的中文手术操作信息字符串中的单个字符或多个连续的字符与所述本体词典中的本体进行匹配;若所述预处理后的中文手术操作信息字符串中的所有字符均能够与本体匹配,则依据所匹配的本体将所述预处理后的中文手术操作信息字符串中的单个字符或多个连续的字符切分出来作为第一类型子字符串;若所述预处理后的中文手术操作信息字符串中存在未能与本体匹配的单个字符或多个连续的字符,则判断所述未能与本体匹配的单个字符或多个连续的字符是否为方位术语或等级术语;当所述未能与本体匹配的单个字符或多个连续的字符为方位术语或等级术语时,根据所述未能与本体匹配的单个字符或多个连续的字符在所述预处理后的中文手术操作信息字符串中的位置,将所述未能与本体匹配的单个字符或多个连续的字符与其之前或之后能够与本体匹配的单个字符或多个连续的字符合并切分出来作为第二类型子字符串,并将所述预处理后的中文手术操作信息字符串中其余的能够与本体匹配的单个字符或多个连续的字符切分出来作为第一类型子字符串;当所述未能与本体匹配的单个字符或多个连续的字符不为方位术语或等级术语时,将所述预处理后的中文手术操作信息字符串整体切分出来作为第二类型子字符串。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易保互联医疗信息科技(北京)有限公司,未经易保互联医疗信息科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510496500.3/,转载请声明来源钻瓜专利网。
- 上一篇:发动机舱左纵梁及发动机舱前围总成
- 下一篇:南瓜洗面奶