[发明专利]病历文本分析方法、装置、电子设备及存储介质有效
申请号: | 202011360065.9 | 申请日: | 2020-11-27 |
公开(公告)号: | CN112182168B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 尤心心;刘喜恩;吴及 | 申请(专利权)人: | 北京惠及智医科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G16H10/60;G06F40/30;G06N3/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 102299 北京市昌平区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 病历 文本 分析 方法 装置 电子设备 存储 介质 | ||
1.一种病历文本分析方法,其特征在于,包括:
基于若干个病历文本与多种疾病对应的多种解释因子的匹配关系,构建所述若干个病历文本的层级结构图;
将所述层级结构图输入至文本分析模型,得到所述文本分析模型输出的每一病历文本对应的疾病类型,以及每一病历文本对应的解释因子;
其中,所述文本分析模型是基于样本病历文本及其匹配的解释因子,以及所述样本病历文本对应的样本疾病类型训练得到的;所述任一疾病对应的解释因子为与所述任一疾病相关的常识类信息,所述解释因子为词语或短语。
2.根据权利要求1所述的病历文本分析方法,其特征在于,所述基于若干个病历文本与多种疾病对应的多种解释因子的匹配关系,构建所述若干个病历文本的层级结构图,包括:
建立初始结构图,所述初始结构图包括所述若干个病历文本分别对应的病历节点、与每一病历文本匹配的解释因子对应的解释因子节点,以及词共现图;所述词共现图包括所述若干个病历文本与所述多种疾病对应的多种解释因子中每一词语对应的词语节点,用于表示所述每一词语之间的共现关系;
基于每一病历文本中包含的词语,建立病历节点与词语节点之间的连接关系;
基于与每一解释因子匹配的病历文本中包含的词语,建立解释因子节点与词语节点之间的连接关系,得到所述层级结构图。
3.根据权利要求2所述的病历文本分析方法,其特征在于,所述基于与每一解释因子匹配的病历文本中包含的词语,建立解释因子节点与词语节点之间的连接关系,得到所述层级结构图,包括:
基于任一解释因子的匹配片段中每一词语相对于所述任一解释因子的重要性和鉴别性,建立所述任一解释因子对应的解释因子节点与词语节点之间的连接关系;
其中,所述任一解释因子的匹配片段为与所述任一解释因子匹配的病历文本中的语义片段。
4.根据权利要求1所述的病历文本分析方法,其特征在于,所述文本分析模型的损失函数是基于所述样本病历文本的语义特征和所述样本病历文本的语义特征与样本疾病类型的语义特征的相似性确定的,所述样本疾病类型是基于与所述样本病历文本匹配的解释因子确定的。
5.根据权利要求2所述的病历文本分析方法,其特征在于,所述匹配关系是基于如下方法确定的:
确定所述词共现图中各个词语的语义特征;
基于任一文本片段或任一解释因子中各个词语的语义特征,分别确定所述任一文本片段或所述任一解释因子的语义特征;
基于所述任一文本片段的语义特征和每一解释因子的语义特征,确定与所述任一文本片段匹配的解释因子。
6.根据权利要求5所述的病历文本分析方法,其特征在于,所述语义特征包括粗粒度特征和细粒度特征;
所述基于所述任一文本片段的语义特征和每一解释因子的语义特征,确定与所述任一文本片段匹配的解释因子,包括:
将任一文本片段的细粒度特征和粗粒度特征,与任一解释因子的细粒度特征和粗粒度特征进行两两匹配,得到所述任一文本片段与所述任一解释因子的多粒度匹配结果;
基于所述任一文本片段对应每一解释因子的多粒度匹配结果,确定与所述任一文本片段匹配的解释因子。
7.根据权利要求2或5所述的病历文本分析方法,其特征在于,所述词共现图是基于如下方法确定的:
将所述若干个病历文本中各个文本片段和所述多种疾病对应的多种解释因子中每个词语作为一个词语节点;
基于任一词语在每一文本片段和每一解释因子中与其他词语的共现关系,确定所述任一词语对应的词语节点与其他词语节点的连接关系,并将所述任一词语对应的词语节点与其自身相连。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京惠及智医科技有限公司,未经北京惠及智医科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011360065.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光学邻近校正模型的建模方法及建模系统
- 下一篇:点云数据处理方法和装置