[发明专利]一种提供诊断依据的中文病历辅助诊断方法及系统有效
申请号: | 202010177227.9 | 申请日: | 2020-03-13 |
公开(公告)号: | CN111462893B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 曾祥荣 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06F40/284 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 赵真 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提供 诊断 依据 中文 病历 辅助 方法 系统 | ||
本发明公开了一种提供诊断依据的中文病历辅助诊断方法及系统,所述方法包括:获取目标患者的中文病历;根据所述中文病历确定目标词序列,其中,所述目标词序列的长度为n+1,n大于等于1,且取整数;将所述目标词序列输入至目标BERT模型,得到目标向量序列,其中,所述目标向量序列中的向量与所述目标词序列中的词项一一对应;根据所述目标向量序列中的第n+1个向量预测所述目标患者所患有的疾病;根据所述目标向量序列的前n个向量确定诊断依据。通过本发明的技术方案,不仅能够预测疾病,而且能够获得诊断依据,具有可解释性。
技术领域
本发明涉及医疗技术领域,特别涉及一种提供诊断依据的中文病历辅助诊断方法及系统。
背景技术
现有的基于神经网络的病历辅助诊断系统,通常利用大规模的中文病历训作为训练数据,训练一个神经网络。训练好的神经网络可以在输入未见过的病历的情况下,预测该病历所反映的疾病。
但是,现有的基于神经网络的病理辅助诊断系统只能根据输入的病历预测疾病,而无法给出做出该判断的依据,因而不具有可解释性。
发明内容
本发明提供一种提供诊断依据的中文病历辅助诊断方法及系统,所述技术方案如下:
根据本发明实施例的第一方面,提供了一种提供诊断依据的中文病历辅助诊断方法,包括:
获取目标患者的中文病历;
根据所述中文病历确定目标词序列,其中,所述目标词序列的长度为n+1,n大于等于1,且取整数;
将所述目标词序列输入至目标BERT模型,得到目标向量序列,其中,所述目标向量序列中的向量与所述目标词序列中的词项一一对应;
根据所述目标向量序列中的第n+1个向量预测所述目标患者所患有的疾病;
根据所述目标向量序列的前n个向量确定诊断依据。
在一个实施例中,所述根据所述中文病历确定目标词序列,包括:
根据预设分词工具对所述中文病历进行拆分,以得到原始词序列;
在所述原始词序列的末端增加目标字符,以得到所述目标词序列。
在一个实施例中,所述根据所述目标向量序列中的第n+1个向量预测所述目标患者所患有的疾病,包括:
确定不同的疾病;
基于所述不同的疾病,通过第一预设公式对第n+1个向量进行计算,以得到所述中文病例分别属于所述不同的疾病的概率;
确定概率最大值对应的疾病为所述目标患者所患有的疾病。
在一个实施例中,所述根据所述目标向量序列的前n个向量确定诊断依据,包括:
确定诊断依据标签和非诊断依据标签;
基于所述诊断依据标签和所述非诊断依据标签,通过第二预算公式对所述目标向量序列的前n个向量分别进行计算,以得到所述目标词序列中前n个词项分别属于所述诊断依据标签和所述非诊断依据标签的概率;
分别确定概率大的标签为所述目标词序列中前n个词项分别对应的标签;
将所述前n个词项中连续且标注为所述诊断依据标签的词项合并成目标短语;
确定所述目标短语为所述诊断依据。
在一个实施例中,在将所述目标词序列输入至目标BERT模型,得到目标向量序列之前,还包括:
获取原始BERT模型及训练数据集;
通过所述训练数据集对所述原始BERT模型进行训练,以得到所述目标BERT模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010177227.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实体链接方法及装置
- 下一篇:风格库配置方法、装置、计算机设备和存储介质