[发明专利]电子病历结构化方法、装置、计算机设备和存储介质在审
申请号: | 202010922768.X | 申请日: | 2020-09-04 |
公开(公告)号: | CN112016279A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 周晓峰 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G16H10/60;G06N3/04;G06N3/08;G06F16/35 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;曹勇 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子 病历 结构 方法 装置 计算机 设备 存储 介质 | ||
1.一种电子病历结构化方法,其特征在于,包括以下步骤:
获取电子病历文本,以及所述电子病历文本的句子数;
检测所述电子病历文本的句子数是否超过预设阀值;
若超过,则将所述电子病历文本进行截断,得到多个电子病历子文本;
将每个所述电子病历子文本通过预设规则引入上下文,得到目标病历文本;
将所述目标病历文本中的每个句子映射为固定维度的句向量;
将每个所述目标病历文本中的所述句向量按照所述句向量所对应的句子在所述目标病历文本中的顺序输入至分类模型中进行计算,得到第一输出;其中,所述分类模型基于双向循环神经网络模型训练而成;
根据所述第一输出得到每个句子的分类标签。
2.根据权利要求1所述的电子病历结构化方法,其特征在于,所述根据所述第一输出得到每个句子的分类标签的步骤,包括:
将每个所述句向量的所述第一输出输入至CRF网络和/或自注意力网络中,得到第二输出;
将每个所述句向量的所述第二输出经过SOFTMAX计算,得到每个句子的分类标签。
3.根据权利要求1所述的电子病历结构化方法,其特征在于,所述将所述目标病历文本中的每个句子映射为固定维度的句向量的步骤,包括:
将所述目标病历文本中的每个句子输入至神经网络中;
通过所述神经网络的encoder将每个所述句子映射为固定维度的句向量。
4.根据权利要求1所述的电子病历结构化方法,其特征在于,所述将每个所述电子病历子文本通过预设规则引入上下文,得到目标病历文本的步骤,包括:
检测各个所述电子病历子文本在所述电子病历文本中的位置;
当所述电子病历子文本在所述电子病历文本的位置为开始时,在所述电子病历子文本的截断处引入下一个电子病历子文本中开始部分的预设个数的句子;
当所述电子病历文本在所述电子病历文本的位置为中间时,在所述电子病历子文本的开始截断处引入上一个电子病历子文本的结尾部分预设个数的句子,在所述电子病历子文本的结尾截断处引入下一个电子病历子文本的开始部分的预设个数的句子;
当所述电子病历子文本在所述电子病历文本的位置为结尾时,在所述电子病历子文本的截断处引入上一个电子病历子文本中结尾部分的预设个数的句子。
5.根据权利要求1所述的电子病历结构化方法,其特征在于,所述检测所述电子病历文本的句子数是否超过预设阀值的步骤之后,包括:
若不超过,将所述电子病历文本中的每个句子映射为固定维度的句向量;
将每个所述电子病历文本中的所述句向量按照顺序输入至所述分类模型中进行计算,得到第三输出;
将每个所述句向量的所述第三输出经过SOFTMAX计算,得到每个句子的分类标签。
6.根据权利要求1所述的电子病历结构化方法,其特征在于,所述将每个所述目标病历文本中的所述句向量按照所述句向量所对应的句子在所述目标病历文本中的顺序输入至分类模型中进行计算,得到第一输出的步骤之前,包括:
获取训练数据集中的病例样本,所述病历样本中各个句子具有正确分类标签;
对所述病历样本进行截断,得到多个病历子样本;
将每个所述病历子样本通过预设规则引入上下文,得到目标病历样本;
将所述目标病历样本中的每个句子映射为固定维度的句向量;
将每个所述目标病历文本中的所述句向量按照顺序输入至双向循环神经网模型中进行计算,得到训练输出;
将所述训练输出经过SOFTMAX计算得到预测输出;
通过损失函数计算所述病历子样本中的各个句子的损失值;
根据所述损失值确定分类模型参数,完成分类模型的训练。
7.根据权利要求6所述的电子病历结构化方法,其特征在于,所述通过损失函数计算所述病历子样本中的各个句子的损失值的步骤,包括:
通过交叉熵函数计算所述病历子样本中的各个句子的损失值;所述交叉熵函数的公式为:所述y为预测输出,为所述正确分类标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010922768.X/1.html,转载请声明来源钻瓜专利网。