[发明专利]错误医疗文本的生成方法、装置及存储介质有效
申请号: | 202011135476.8 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112016281B | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 张颖 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/226;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 错误 医疗 文本 生成 方法 装置 存储 介质 | ||
1.一种错误医疗文本的生成方法,其特征在于,包括:
获取多个第一医疗文本,其中,所述多个第一医疗文本中的每个第一医疗文本为正确的医疗文本;
将所述每个第一医疗文本输入到完成训练的第一神经网络,得到与所述每个第一医疗文本对应的第二医疗文本,其中,所述第二医疗文本为错误的医疗文本,具体包括:通过所述完成训练的第一神经网络,对所述每个第一医疗文本中的目标词语进行替换操作,得到至少一个第三医疗文本,其中,所述目标词语包括以下至少一种:所述每个第一医疗文本中的实体词、形容词、动词、名词和垂类词,所述至少一个第三医疗文本中的每个第三医疗文本对应一个评分,所述每个第三医疗文本对应的评分用于表征所述每个第三医疗文本与所述每个第一医疗文本之间的相似度;将所述每个第三医疗文本对应的评分与一个随机数进行求和,得到所述每个第三医疗文本对应的最终评分,其中,所述每个第三医疗文本有各自对应的一个随机数,且所述每个第三医疗文本对应的随机数是通过随机函数生成的;根据所述每个第三医疗文本对应的最终评分,将最终评分最大的第三医疗文本作为与所述每个第一医疗文本对应的第二医疗文本。
2.根据权利要求1所述的方法,其特征在于,所述通过所述完成训练的第一神经网络,对所述每个第一医疗文本中的目标词语进行替换操作,得到至少一个第三医疗文本,包括:
通过所述完成训练的第一神经网络,对所述每个第一医疗文本的目标词语进行编码操作,得到所述目标词语对应的目标意图;
从字典库中获取与所述目标意图匹配的至少一个第一意图;
通过第二神经网络,对所述每个第一意图进行解码操作,得到与所述至少一个第一意图对应的至少一个待替换词语;
分别使用所述至少一个待替换词语中的每个待替换词语,对所述目标词语进行替换操作,得到所述至少一个第三医疗文本。
3.根据权利要求1或2所述的方法,其特征在于,在所述获取多个第一医疗文本之前,所述方法还包括:
获取第一训练样本和第一训练标签,其中,所述第一训练样本为正确的医疗文本,第一训练标签为标注好的与所述第一训练样本对应的错误的医疗文本;
将所述第一训练样本输入到所述第一神经网络,得到第四医疗文本;
根据所述第四医疗文本和所述第一训练标签,对所述第一神经网络的网络参数进行调整,以对所述第一神经网络进行训练。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
对所述每个第一医疗文本对应的第二医疗文本添加第二训练标签,并将所述第二训练标签以及与所述第二训练标签对应的第二医疗文本组成第二训练样本,其中,所述第二训练标签用于表示所述第二医疗文本为错误的医疗文本;
使用所述第二训练样本对第二神经网络进行训练;
获取待识别医疗文本,并将所述待识别医疗文本输入完成训练的第二神经网络,对所述待识别医疗文本进行分类,确定所述待识别医疗文本是否为正确的医疗文本;
在确定所述待识别医疗文本为正确的医疗文本的情况下,直接输出所述待识别医疗文本;
在确定所述待识别医疗文本为错误的医疗文本的情况下,对所述待识别医疗文本进行纠错,并输出纠错后的医疗文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011135476.8/1.html,转载请声明来源钻瓜专利网。