[发明专利]一种相似病历智能匹配方法在审
申请号: | 202111663667.6 | 申请日: | 2021-12-31 |
公开(公告)号: | CN115188440A | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 欧家满;莫北溪;阮舒华;郑伊颖;邓木清;邓凤阳 | 申请(专利权)人: | 阳江市人民医院 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F40/194;G06N3/04;G06N3/08 |
代理公司: | 广州蓝晟专利代理事务所(普通合伙) 44452 | 代理人: | 欧阳凯 |
地址: | 529500 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相似 病历 智能 匹配 方法 | ||
本发明公开了一种相似病历智能匹配方法,包括如下步骤:步骤一:提取待分析的电子病历中关键字段信息,删除提取字段数据中缺失和重复数据,将关键字段文本切分为单个词符,找出最大切分组合,得到关键字段的词向量表示;步骤二:关键字段词向量作为深度神经网络预训练模型的输入,将三个经过大规模文本数据库训练得到的语义模型作为特征提取器,配合全连接网络实现对关键字段词向量进行迁移特征学习;步骤三:依据验证字段与训练库已训练字段的特征向量相似度,对深度迁移特征学习后所得的特征矩阵进行加权融合,结合不同分类器策略,得到相似病历的智能匹配结果。本发明可以更好适应复杂应用场景的实际需求,能够应对复杂的应用场景。
技术领域
本发明属于模式识别技术领域,具体涉及一种相似病历智能匹配方法。
背景技术
随着电子病历系统的普及,相似病历匹配方法及系统在发挥着越来越重要的作用,所涉及的语义相似度的计算作为自然语言理解领域的重要内容,在人工智能以及推荐系统中发挥着重要的作用。同一个医生会面对具有相同病情和症状的患者,相似病历匹配可以减少重复劳动,也为训练新进医生提供有效渠道和帮带途径。为此,我们提出一种相似病历智能匹配方法,以解决上述背景技术中提到的问题。
发明内容
本发明的目的在于提供一种相似病历智能匹配方法,以解决上述背景技术中提出的问题。
本发明提取待分析的电子病历中关键字段信息,将关键字段词向量作为深度神经网络预训练模型的输入,将三个经过大规模文本数据库训练得到的语义模型作为特征提取器,配合全连接网络实现对关键字段词向量进行迁移特征学习;依据测试字段与训练库已训练字段的浅层文本相似度,对深度迁移特征学习后所得的特征矩阵进行加权融合,结合不同的分类器策略,得到相似病历的智能匹配结果。
为实现上述目的,本发明提供如下技术方案:一种相似病历智能匹配方法,包括如下步骤:
步骤一:提取待分析的电子病历中关键字段信息,删除所提取字段数据中的缺失和重复数据,将关键字段文本切分为单个词符,找出基于词频的最大切分组合,得到关键字段的词向量表示;
步骤二:将关键字段词向量作为深度神经网络预训练模型的输入,将三个经过大规模文本数据库训练得到的语义模型作为特征提取器,配合全连接网络实现对关键字段词向量进行迁移特征学习;
步骤三:依据验证字段与训练库已训练字段的特征向量相似度,对深度迁移特征学习后所得的特征矩阵进行加权融合,结合不同的分类器策略,得到相似病历的智能匹配结果。
所述步骤一的具体实现方法如下:
所述待分析的电子病历中关键字段信息包括主诉、入院诊断、院内检查及出院诊断四个字段的信息,依据“主诉”、“入院诊断”、“院内检查”及“出院诊断”四个关键词进行提取;
所述词向量表示的提取具体包括将关键字段文本切分为单个词符,找出基于词频的最大切分组合,使用One-Hot方法获得待分析文本的词向量表示。
所述步骤二的具体实现方法如下:
将预处理得到的词向量分别作为深度神经网络预训练模型Bert,ALBert和RoBerta的输入,在每个预训练模型的末端增加一层全连接层,进行迁移特征学习,完成文本的深度特征提取,形成对应于三个预训练模型的深度特征矩阵F1,F2,F3。
所述步骤三的具体实现方法如下:
计算测试字段与训练库已训练字段的特征向量相似度,具体为:计算测试字段与训练库中已训练字段对应特征向量的余弦相似度,所得余弦相似度形成文本相似度,记为ε1,ε2,ε3,以ε12+ε22+ε32的二次平方根为度量值,取度量值最近邻10个已训练特征向量,其与所验证特征向量之间的余弦相似度值的平均值作为判断三个深度学习模型习得的特征向量在最终分类任务中的权重值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阳江市人民医院,未经阳江市人民医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111663667.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:类球红细菌接合转化方法
- 下一篇:一种齿轮及其制备方法