[发明专利]医疗文本纠错方法及装置、存储介质、电子设备在审
申请号: | 202210333402.8 | 申请日: | 2022-03-30 |
公开(公告)号: | CN114881006A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 陈文昌;李思敏;杨亮;任保森;李林峰 | 申请(专利权)人: | 医渡云(北京)技术有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/295;G16H20/10;G06F16/36;G06V10/74;G06V30/148;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 文本 纠错 方法 装置 存储 介质 电子设备 | ||
本公开属于自然语言处理技术领域,涉及一种医疗文本纠错方法及装置、存储介质、电子设备。该方法包括:获取目标医疗文本和医学命名实体,并对目标医疗文本进行语境置信度计算得到候选字和候选字的语境置信度;对目标医疗文本和候选字进行字符相似度计算得到字符相似度,并对候选字和医学命名实体进行实体相似度计算得到实体相似度;基于语境置信度、字符相似度和实体相似度,利用候选字对目标医疗文本进行文本纠错。本公开为目标医疗文本的文本纠错提供了数据基础和理论支持,丰富了文本纠错可依据的数据维度,从数据全面性方面保证了错字检错和纠正的准确性,提升了医疗文本的纠错效果,通过系统性的文本纠错方法提升了医疗文本纠错的扩展性。
技术领域
本公开涉及自然语言处理技术领域,尤其涉及一种医疗文本纠错方法与医疗文本纠错装置、计算机可读存储介质及电子设备。
背景技术
错字检查是NLP(Natural Language Processing,自然语言处理)领域最重要的问题之一。虽然有多种经典方法能够实现错字检查,但是由于经典方法无法准确把握句子的真实语义,导致错字检查成本高,且扩展性差。因此,深度学习成功应用于自然语言处理中,并在多数任务中都超越了经典方法。
然而,在医学领域的文本中,由于术语的复杂性和语言的特殊性,常用的深度学习模型常常无功而返。不同语言的纠错方式也不同,国外的各种语言病历文本纠错中,大多应用了制定医学领域的相关规则的方式。而中文病历等医疗文本的纠正大多基于字典和规则,存在准确性差、维护难和扩展性弱等问题。
鉴于此,本领域亟需开发一种新的医疗文本纠错方法及装置。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种医疗文本纠错方法、医疗文本纠错装置、计算机可读存储介质及电子设备,进而至少在一定程度上克服由于相关技术的限制而导致的准确性差、维护难和扩展性弱的技术问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种医疗文本纠错方法,所述方法包括:获取目标医疗文本和医学命名实体,并对所述目标医疗文本进行语境置信度计算得到候选字和所述候选字的语境置信度;
对所述目标医疗文本和所述候选字进行字符相似度计算得到字符相似度,并对所述候选字和所述医学命名实体进行实体相似度计算得到实体相似度;
基于所述语境置信度、所述字符相似度和所述实体相似度,利用所述候选字对所述目标医疗文本进行文本纠错。
在本公开的一种示例性实施例中,所述对所述目标医疗文本进行语境置信度计算得到候选字和所述候选字的语境置信度,包括:
将所述目标医疗文本输入至预先训练好的医学语言表征模型中,以使所述预先训练好的医学语言表征模型对所述目标医疗文本进行语境置信度计算得到候选字和所述候选字的语境置信度。
在本公开的一种示例性实施例中,在所述将所述目标医疗文本输入至预先训练好的医学语言表征模型中之前,所述方法还包括:
获取训练待训练的医学语言表征模型的医疗文本正样本;
将所述医疗文本正样本输入至所述待训练的医学语言表征模型中,以对所述待训练的医学语言表征模型进行训练,直至完成训练得到预先训练好的医学语言表征模型。
在本公开的一种示例性实施例中,所述对所述目标医疗文本和所述候选字进行字符相似度计算得到字符相似度,包括:
对所述目标医疗文本和所述候选字的字形进行字形相似度计算得到所述字形相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于医渡云(北京)技术有限公司,未经医渡云(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210333402.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种拆分式四合一卡车换电站
- 下一篇:跨域物联网僵尸网络群落检测方法和系统