[发明专利]一种多重诊断智能编码方法、系统、介质及设备有效
申请号: | 202110038682.5 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112836006B | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 李森;吴军;孙钊;桑波;李福友;郝旭阳;鲁成霞 | 申请(专利权)人: | 山东众阳健康科技集团有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F40/289;G16H10/60 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
地址: | 250000 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多重 诊断 智能 编码 方法 系统 介质 设备 | ||
1.一种多重诊断智能编码方法,其特征在于,包括:
接收临床原始多重诊断数据并进行预处理操作;
将预处理后多重诊断数据进行分词处理,得到分词结果集合;分词结果集合中的元素由修饰词和主导词组合构成;
将分词结果集合中所有词汇进行语义联想转换处理;
将语义联想转换处理得到的全组合进行语匹配树搜索处理,对筛选出来的匹配树按匹配组的匹配度从高到低进行降序排列,取排序第一的匹配树组作为编码结果;
其中,匹配树的树根是疾病标准编码,树干是诊断名称,树枝是诊断名称的具体组成部分,树叶是诊断拆分的主导词和修饰词;
匹配树相似度指的是诊断数据与匹配树的相似度,其计算过程为:
将各诊断关键词到匹配树叶子关键词的路径长度求自然对数并进行累加;
所述匹配树按匹配度从高到低进行降序排列,具体步骤是:
步骤(a1):选取所有匹配树的主导词是组合关键词所有主导词子集,并且组合关键词的所有修饰词是匹配树修饰词子集的匹配树,作为候选匹配树集Treeset={Tree1,Tree2...Treen};
步骤(a2):将候选匹配树集分组,其中各匹配树主导词不能重复,即各组内匹配树主导词交集为空;
步骤(a3)计算各匹配组的匹配度,将匹配树候选组按匹配度进行降序排列;匹配组中匹配树个数为ntree,修饰词与主导词距离Sdistance,匹配树组所有主导词与组合关键词中主导词交集的元素个数nmain,匹配树组所有修饰词与组合关键词中修饰词交集的元素个数nmodifier,匹配树相似度Ssim组成集合X={ntree,sdiatance,nmain,nmodifier,ssim},匹配度为:
Match=αTX
其中,αT为加权系数,然后按照匹配度由高到低进行排序,取排序第一的匹配树组作为编码结果。
2.如权利要求1所述的多重诊断智能编码方法,其特征在于,所述预处理操作包括特殊字符的处理、异体字的转换以及标点符号的处理。
3.如权利要求1所述的多重诊断智能编码方法,其特征在于,经语义联想转换处理后,得到主导词与修饰词的所有转换可能集合,进而得到主导词转换集合与修饰词转换集合组成的全组合集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东众阳健康科技集团有限公司,未经山东众阳健康科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110038682.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度学习和知识图谱的患者画像方法及系统
- 下一篇:制备阿塞那平的方法