[发明专利]一种临床诊断标准词的匹配方法及装置有效
申请号: | 202310954858.0 | 申请日: | 2023-08-01 |
公开(公告)号: | CN116663536B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 张奇;王勤勤;王实 | 申请(专利权)人: | 北京惠每云科技有限公司 |
主分类号: | G06F40/247 | 分类号: | G06F40/247;G06F40/205;G06F40/284;G06F16/35;G06F16/36;G06N3/045;G06N3/0442;G06N3/08 |
代理公司: | 北京超凡宏宇知识产权代理有限公司 11463 | 代理人: | 于彬 |
地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 临床 诊断 标准 匹配 方法 装置 | ||
1.一种临床诊断标准词的匹配方法,其特征在于,所述匹配方法包括:
通过对获取到的病历文本进行分析处理,从所述病历文本中提取出临床诊断原词;
对所述临床诊断原词进行预处理,得到标准诊断原词;
分别在预先构建的医疗文本库和医疗知识图谱中搜索,确定所述标准诊断原词的原词上下文特征以及每个候选诊断标准词的标准上下文特征;
基于所述原词上下文特征和每个标准上下文特征,通过预先训练好的标准词匹配模型,从至少一个候选诊断标准词中,确定出与所述临床诊断原词相匹配的至少一个目标诊断标准词。
2.根据权利要求1所述的匹配方法,其特征在于,对所述临床诊断原词进行预处理,得到标准诊断原词,包括:
针对于所述临床诊断原词中包括的全角字符,将所述全角字符转换为半角字符,得到字符转换后的临床诊断原词;
针对于所述字符转换后的临床诊断原词中包括的小写字母,将所述小写字母转换为大写字母,得到字母转换后的临床诊断原词。
3.根据权利要求1所述的匹配方法,其特征在于,所述分别在预先构建的医疗文本库和医疗知识图谱中搜索,确定所述临床诊断原词的原词上下文特征以及每个候选诊断标准词的标准上下文特征,包括:
分别利用所述标准诊断原词和每个候选诊断标准词,在预先构建的医疗文本库中搜索,确定出现所述标准诊断原词的第一病历原文和出现每个候选诊断标准词的第二病历原文;
分别利用所述标准诊断原词和每个候选诊断标准词,在预先构建的医疗知识图谱中搜索,获取所述标准诊断原词对应的原词图嵌入特征和每个候选诊断标准词的候选图嵌入特征;
将所述标准诊断原词、所述第一病历原文以及所述原词图嵌入特征,确定为所述标准诊断原词的原词上下文特征;
针对于每个候选诊断标准词,将该候选诊断标准词、该候选诊断标准词的第二病历原文和该候选诊断标准词的候选图嵌入特征,确定为该候选诊断标准词的标准上下文特征。
4.根据权利要求1所述的匹配方法,其特征在于,所述标准词匹配模型包括Bert模型和分类器;所述基于所述原词上下文特征和每个标准上下文特征,通过预先训练好的标准词匹配模型,从至少一个候选诊断标准词中,确定出与所述临床诊断原词相匹配的至少一个目标诊断标准词,包括:
将所述原词上下文特征和每个标准上下文特征作为输入特征,输入预先训练好的Bert模型,确定所述标准诊断原词与每个候选诊断标准词之间的关联相似度以及所述临床诊断原词所匹配的目标诊断标准词的匹配数量;
基于确定出的至少一个关联相似度和所述匹配数量,通过预先训练好的分类器,从所述至少一个候选诊断标准词中确定出所述匹配数量的目标诊断标准词。
5.根据权利要求4所述的匹配方法,其特征在于,所述Bert模型包括第一Bert子模型和第二Bert子模型;所述将所述原词上下文特征和每个标准上下文特征作为输入特征,输入预先训练好的Bert模型,确定所述标准诊断原词与每个候选诊断标准词之间的关联相似度以及所述临床诊断原词所匹配的目标诊断标准词的匹配数量,包括:
将所述原词上下文特征和每个标准上下文特征,输入所述第一Bert子模型,确定所述标准诊断原词与每个候选诊断标准词之间的关联相似度;
将所述原词上下文特征输入所述第二Bert子模型,预测所述临床诊断原词所匹配的目标诊断标准词的匹配数量。
6.根据权利要求1所述的匹配方法,其特征在于,通过以下步骤确定至少一个候选诊断标准词:
获取标准词库中已存储的多个预设诊断标准词;
针对于每个预设诊断标准词,对该预设诊断标准词进行分词处理,得到该预设诊断标准词的多个子分词;
借助于开源自然语言处理库,将所述多个子分词进行向量化处理,得到该预设诊断标准词的向量表示形式;
基于每个预设诊断标准词的向量表示形式以及所述标准诊断原词的向量表示形式,确定所述标准诊断原词与每个预设诊断标准词的相似分值;
基于确定多个相似分值,从所述多个预设诊断标准词中确定出至少一个候选诊断标准词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京惠每云科技有限公司,未经北京惠每云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310954858.0/1.html,转载请声明来源钻瓜专利网。