[发明专利]一种病例文书中疾病诊断的自动切分方法及装置有效
申请号: | 202010165645.6 | 申请日: | 2020-03-11 |
公开(公告)号: | CN111462913B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 舒波 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H70/20 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 赵真 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 病例 文书 疾病诊断 自动 切分 方法 装置 | ||
1.一种病例文书中疾病诊断的自动切分方法,其特征在于,包括:
对病例文书中的疾病诊断进行预处理,以得到标准化的疾病诊断;
获取自动标记的数据及人工标记的数据;
根据所述自动标记的数据及所述人工标记的数据确定目标BERT模型;
将所述标准化的疾病诊断输入至所述目标BERT模型,以得到模型预测的标签;
根据所述预测的标签确定所述标准化的疾病诊断的切分结果;
所述获取自动标记的数据,包括:
获取具有第一特征的第一诊断数据和具有第二特征的第二诊断数据;
通过第一规则对所述第一诊断数据进行标记,得到标记后的第一诊断数据;
其中,第一规则是在数字与特殊符号后面答标记;
通过第二规则对所述第二诊断数据进行标记,得到标记后的第二诊断数据;
其中,第二规则是在第一个文字和特殊符号后面标记;
根据所述标记后的第一诊断数据和所述标记后的第二诊断数据确定目标字典;
将所述目标字典中的若干条疾病按照第三规则进行组合,以得到第三诊断数据;
其中,第三规则是以特殊符号组合疾病、以数字组合疾病、以数字与特殊符号一起组合疾病;
确定所述第三诊断数据为所述自动标记的数据;
所述对病例文书中的疾病诊断进行预处理,以得到标准化的疾病诊断,包括:
去除所述疾病诊断中符合预设标准的符号,以得到去除符号后的疾病诊断;
对所述去除符号后的疾病诊断进行标准化处理,以得到所述标准化的疾病诊断;
所述根据所述自动标记的数据及所述人工标记的数据确定目标BERT模型,包括:
获取原始BERT模型;
确定所述自动标记的数据及所述人工标记的数据为训练集;
根据所述训练集对所述原始BERT模型进行训练,以得到所述目标BERT模型。
2.如权利要求1所述的方法,其特征在于,所述根据所述预测的标签确定所述标准化的疾病诊断的切分结果,包括:
将所述标准化的疾病诊断与所述预测的标签进行结合,以得到结合结果;
根据第四规则对所述结合结果进行切分,以得到所述标准化的疾病诊断的切分结果;
其中,第四规则是指从第一个“1”对应的位置开始切分,然后确定“0”对应的文字数量,舍弃掉“0”对应的不是文字的符号,然后添加分隔符,依次往下进行,完成切分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010165645.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车检测报警装置
- 下一篇:形拼意汉字输入方法及电子设备