[发明专利]一种病例书的切分方法、装置、电子设备及可读存储介质有效
申请号: | 202110867572.X | 申请日: | 2021-07-30 |
公开(公告)号: | CN113312913B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 袁正航;李丽;张奇 | 申请(专利权)人: | 北京惠每云科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G16H10/60 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘凤 |
地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 病例 切分 方法 装置 电子设备 可读 存储 介质 | ||
1.一种病例书的切分方法,其特征在于,所述切分方法包括:
针对于待切分病例书中的每一个初始关键词,对该初始关键词进行特征计算,得到与该初始关键词对应的特征序列,并将所述特征序列输入至预先训练好的关键词判别模型中,得到该初始关键词的关键词判断结果;
基于各个关键词判断结果指示为切分关键词的初始关键词,以及预先设置的补偿关键词规则,确定待切分病例书对应的多个目标关键词;
针对于每个目标关键词,按照预设关键词映射知识图谱对该目标关键词进行关键词映射,得到与该目标关键词对应的标准关键词;
基于得到的多个标准关键词,对所述待切分病例书进行切分,得到切分后的可按照切分字段进行统一存储的切分病例书;
所述针对于每一个初始关键词,对该初始关键词进行特征计算,得到与该初始关键词对应的特征序列,包括:
确定与所述初始关键词关联的前缀字段的前缀标记特征、后缀字段的后缀标记特征;
利用至少一个预设判别规则,分别对所述前缀字段、后缀字段以及所述初始关键词进行特征判断,确定所述关键词的属性特征;
确定位序在所述初始关键词之前的前序关键词以及位序在该初始关键词之后的后序关键词;
基于所述前缀标记特征、所述后缀标记特征、所述属性特征、所述前序关键词以及所述后序关键词,按照预设序列排序规则,生成与所述初始关键词对应的特征序列。
2.根据权利要求1所述的切分方法,其特征在于,所述针对于每个目标关键词,按照预设关键词映射知识图谱对该目标关键词进行关键词映射,得到与该目标关键词对应的标准关键词,包括:
检测所述目标关键词是否属于标准关键词集合,若所述目标关键词属于标准关键词集合,直接将所述目标关键词确定为标准关键词;
若所述目标关键词不属于标准关键词集合,基于所述目标关键词的关联关系,得到与该目标关键词对应的标准关键词。
3.根据权利要求2所述的切分方法,其特征在于,所述若所述目标关键词不属于标准关键词集合,基于所述目标关键词的关联关系,得到与该目标关键词对应的标准关键词,包括:
检测与所述目标关键词关联的前序关键词是否属于标准关键词集合,若与所述目标关键词关联的前序关键词属于标准关键词集合,将与所述目标关键词关联的前序关键词确定为标准关键词;
若与所述目标关键词关联的前序关键词不属于标准关键词集合,检测所述目标关键词是否关联默认关键词,若所述目标关键词关联默认关键词,将关联的默认关键词确定为标准关键词。
4.根据权利要求1所述的切分方法,其特征在于,通过以下步骤训练所述关键词判别模型:
基于获取的多个样本病例书,确定多个关键词正训练样本以及多个关键词负训练样本;
针对每个样本病例书,将该样本病例书对应的多个关键词正训练样本以及多个关键词负训练样本输入至构建好的深度学习模型中,得到样本病例书对应的预测关键词结果;
针对每个样本病例书,确定该样本病例书的实际关键词与预测关键词结果指示的关键词是否一致;
若存在样本病例书的实际关键词与预测关键词结果指示的关键词不一致,调整所述深度学习模型中的参数,直至每个样本病例书的实际关键词与预测关键词结果指示的关键词均一致,确定所述深度学习模型训练完毕,并将训练完毕的所述深度学习模型确定为训练好的关键词判别模型。
5.根据权利要求4所述的切分方法,其特征在于,所述关键词正训练样本为所述样本病例书中标注的关键词样本;
所述关键词负训练样本为所述样本病例书中并未标注的关键词样本,或者将关键词的位序交换调整后的样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京惠每云科技有限公司,未经北京惠每云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110867572.X/1.html,转载请声明来源钻瓜专利网。