[发明专利]国际疾病分类编码推荐方法、系统及相应设备和存储介质有效
申请号: | 202010854420.1 | 申请日: | 2020-08-24 |
公开(公告)号: | CN111814463B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 李文斌 | 申请(专利权)人: | 望海康信(北京)科技股份公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/30;G16H40/20 |
代理公司: | 北京金阙华进专利事务所(普通合伙) 11224 | 代理人: | 陈建春 |
地址: | 100176 北京市大兴区经济技*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 国际 疾病 分类 编码 推荐 方法 系统 相应 设备 存储 介质 | ||
1.一种国际疾病分类编码推荐方法,其特征在于,所述方法包括:
将要进行国际疾病分类ICD编码推荐的ICD名称文本到预先形成的实体字典中映射相应的实体;
将映射的实体转换为多维词向量;
将所述多维词向量和所述ICD名称文本输入到经训练的深度学习模型;
将所述深度学习模型的输出中概率最高的前m个ICD亚目编码作为对所述ICD名称文本推荐的ICD亚目编码,m≥1;
其中,所述实体字典通过下述处理形成:
通过中文分词器对ICD编码训练数据集中的ICD名称文本进行至少包括分词的预处理,生成ICD词库;
用知识图谱工具对ICD词库进行预设维度的实体标注;
将标注后的ICD词库整理成数据源文件;
加载数据源文件到长短期记忆神经网络模型进行训练,输出为实体字典。
2.在根据权利要求1所述的方法,其特征在于,所述预设维度包括操作、人体形态与结构、医疗器械、技术、入路和/或体位。
3.根据权利要求1所述的方法,其特征在于,所述ICD编码训练数据集包括多个版本的ICD编码标准库和/或包括临床ICD名称和编码的数据集,所述深度学习模型的训练包括:
将所述ICD编码训练数据集作为深度学习模型的输入进行初步训练;
将所述ICD编码训练数据集所含ICD名称文本分别经实体标注、映射得到的多维词向量输入经初步训练的深度学习模型进行进一步回归训练,使得深度学习模型输出与ICD名称对应的m个ICD亚目编码。
4.根据权利要求1所述的方法,其特征在于,所述预处理还包括下述之一或多个:
根据扩展词字典对专业医学词汇进行不分词处理;
根据同义词字典将ICD名称文本中的不同同义词统一为一个标准词或者将其它相应同义词添加到ICD词库中;
根据停用词字典去除ICD名称文本中的无意义字符;
根据字符过滤器对字符进行转义。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述m个ICD亚目编码分别所属的预设亚目类型;
确定所述m个ICD亚目编码中其置信度高于相应类型的预设置信度阈值的n个ICD亚目编码,n≤m;
基于包含拟使用的ICD编码标准库数据的索引库,采用文本相似度算法从索引库中所述n个ICD亚目编码对应的ICD细目中确定与将要进行ICD编码推荐的ICD名称文本对应的一个ICD细目编码。
6.根据权利要求5所述的方法,其特征在于,所述预设亚目类型按照临床频次分类为高频、中频和低频三类,低频、中频和高频亚目类型的置信度阈值依次递增。
7.根据权利要求5所述的方法,其特征在于,所述文本相似度算法为BW25文本相似度算法。
8.一种国际疾病分类编码推荐系统,其特征在于,所述系统包括:
映射模块,用于将要进行国际疾病分类ICD编码推荐的ICD名称文本到预先形成的实体字典中映射相应的实体;
转换模块,用于将映射的实体转换为多维词向量;
输入模块,用于将所述多维词向量和所述ICD名称文本输入到经训练的深度学习模型;
推荐模块,用于将所述深度学习模型的输出中概率最高的前m个ICD亚目编码作为对所述ICD名称文本推荐的ICD亚目编码,m≥1;
其中,所述实体字典通过下述处理形成:
通过中文分词器对ICD编码训练数据集中的ICD名称文本进行至少包括分词的预处理,生成ICD词库;
用知识图谱工具对ICD词库进行预设维度的实体标注;
将标注后的ICD词库整理成数据源文件;
加载数据源文件到长短期记忆神经网络模型进行训练,输出为实体字典。
9.一种计算机设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中所述处理器执行所述计算机程序时实现根据权利要求1所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据权利要求1所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于望海康信(北京)科技股份公司,未经望海康信(北京)科技股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010854420.1/1.html,转载请声明来源钻瓜专利网。