[发明专利]医疗文本翻译方法、装置及存储介质有效
申请号: | 202011115345.3 | 申请日: | 2020-10-19 |
公开(公告)号: | CN111950303B | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 李春宇;朱威;张开明 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 文本 翻译 方法 装置 存储 介质 | ||
1.一种医疗文本翻译方法,其特征在于,包括:
获取待翻译医疗文本;
将所述待翻译医疗文本进行语义特征提取,得到第一特征向量;
获取与所述待翻译医疗文本对应的目标特征向量,具体包括:对医疗领域中的所有医学知识图谱进行向量化,得到每个医学知识图谱对应的第三特征向量,并根据每个医学知识图谱中的第一实体词,为每个医学知识图谱对应的第三特征向量添加第一实体标签;根据所述待翻译医疗文本中的第二实体词,确定与所述待翻译医疗文本对应的第二实体标签;确定与所述第二实体标签匹配的第一实体标签,并将所述匹配的第一实体标签对应的第三特征向量作为与所述待翻译医疗文本对应的目标特征向量,所述目标特征向量用于表征与所述待翻译医疗文本对应的医学知识图谱;
将所述第一特征向量与所述目标特征向量进行拼接,得到第二特征向量;
根据所述第二特征向量,对所述待翻译医疗文本进行翻译。
2.一种医疗文本翻译方法,其特征在于,包括:
获取待翻译医疗文本;
将所述待翻译医疗文本进行语义特征提取,得到第一特征向量;
获取与所述待翻译医疗文本对应的目标特征向量,具体包括:根据每个医学知识图谱中的第一实体词,对医疗领域中的所有医学知识图谱添加第一实体标签;根据所述待翻译医疗文本中的第二实体词,确定与所述待翻译医疗文本对应的第二实体标签;确定与所述第二实体标签匹配的第一实体标签,并将与所述匹配的第一实体标签对应的医学知识图谱作为目标医学知识图谱;对所述目标医学知识图谱进行向量化,得到与所述待翻译医疗文本对应的目标特征向量,所述目标特征向量用于表征与所述待翻译医疗文本对应的医学知识图谱;
将所述第一特征向量与所述目标特征向量进行拼接,得到第二特征向量;
根据所述第二特征向量,对所述待翻译医疗文本进行翻译。
3.根据权利要求1或2所述的方法,其特征在于,所述将所述待翻译医疗文本进行语义特征提取,得到第一特征向量,包括:
对所述待翻译医疗文本中的每个单词进行词嵌入处理,得到与每个单词对应的词向量;
根据每个单词对应的词向量进行语义特征提取,得到所述第一特征向量。
4.根据权利要求3所述的方法,其特征在于,在根据每个单词对应的词向量进行语义特征提取,得到所述第一特征向量之前,所述方法还包括:
根据自注意力机制以及每个单词对应的词向量,确定每个单词对应的目标词向量;
所述根据每个单词对应的词向量进行语义特征提取,得到所述第一特征向量,包括:
根据每个单词对应的目标词向量进行语义特征提取,得到所述第一特征向量。
5.根据权利要求4所述的方法,其特征在于,所述根据自注意力机制以及每个单词对应的词向量,确定每个单词对应的目标特征向量,包括:
对单词A对应的词向量进行编码,得到与所述单词A对应的关键值向量、查询向量以及价值向量,所述单词A为所述待翻译医疗文本中的任意一个单词;
确定所述单词A对应的查询向量与每个单词对应的关键值向量之间的相似度,并将所述相似度作为所述单词A与每个单词之间的权重;
根据所述单词A与每个单词之间的权重,对每个单词对应的价值向量进行加权处理,得到所述单词A对应的目标词向量。
6.根据权利要求1或2所述的方法,其特征在于,
所述待翻译医疗文本包括中文医疗文本或英文医疗文本,且在所述待翻译医疗文本为中文医疗文本的情况下,所述医学知识图谱为中文医学知识图谱,在所述待翻译医疗文本为英文医疗文本的情况下,所述医学知识图谱为英文医学知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011115345.3/1.html,转载请声明来源钻瓜专利网。