[发明专利]文本处理方法、装置、设备及存储介质在审
申请号: | 202010772951.6 | 申请日: | 2020-08-04 |
公开(公告)号: | CN111814496A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 张祥文;谢军 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/51;G06F40/126;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 处理 方法 装置 设备 存储 介质 | ||
1.一种文本处理方法,其特征在于,包括:
显示文本翻译界面,所述文本翻译界面包括接收待翻译文本的第一区域;
当所述第一区域中存在待翻译文本时,调用翻译处理模型中的翻译子模型对所述待翻译文本进行翻译处理,得到所述待翻译文本对应的目标译文;
调用所述翻译处理模型中的质量评分子模型基于所述待翻译文本和所述目标译文进行评分处理,得到所述目标译文的翻译质量评分;
在所述文本翻译界面包括的第二区域中显示所述目标译文以及所述翻译质量评分。
2.如权利要求1所述的方法,其特征在于,所述第二区域包括触发控件,当所述触发控件被触发为第一状态时,所述第二区域中显示所述目标译文和所述目标译文对应的翻译质量评分;当所述触发控件被触发为第二状态时,所述第二区域中显示所述待翻译文本、所述目标译文以及所述目标译文对应的翻译质量评分。
3.如权利要求1所述的方法,其特征在于,所述翻译子模型包括编码器、解码器和注意机制,所述待翻译文本包括至少一个词,所述调用所述翻译处理模型中的所述翻译子模型对所述待翻译文本进行翻译处理得到目标译文,包括:
调用所述翻译子模型中的编码器对所述至少一个词包括的每个词进行编码处理,得到所述每个词对应的源端隐状态;
当对所述待翻译文本中的任意词进行翻译处理时,调用注意机制基于所述至少一个词中其他词与所述任意词的关联度对所述每个词的源端隐状态进行统一化处理得到处理结果,并将所述处理结果传输至所述解码器中;
调用所述解码器对所述处理结果进行解码处理,得到目标端隐状态,并基于所述目标端隐状态生成任意词对应的译文单词;
基于每个词对应的译文单词生成目标译文。
4.如权利要求3所述的方法,其特征在于,所述编码器包括至少一层或多层编码层,每个词对应的源端隐状态包括至少一个或多个,任意一个编码层中每个词的源端隐状态组成相应编码层对应的源端隐状态集合,所述源端隐状态集合的数量为一个或多个;所述解码器包括至少一个解码层,每个译文单词对应的目标端隐状态的数量为一个或多个,任意一个解码层中每个译文单词对应的目标端隐状态组成相应解码层对应的目标端隐状态集合,所述目标端隐状态集合的数量为一个或多个;
所述调用所述翻译处理模型中的所述质量评分子模型基于所述待翻译文本和所述目标译文进行评分处理,得到所述目标译文对应的翻译质量评分,包括:
基于所述源端隐状态集合确定第一源端隐状态集合,以及基于所述目标端隐状态集合确定第一目标端隐状态集合;
将所述第一源端隐状态集合和所述第一目标端隐状态集合传输至所述质量评分子模型中,以控制所述质量评分子模型进行评分处理,得到所述目标译文对应的翻译质量评分。
5.如权利要求4所述的方法,其特征在于,所述质量评分子模型包括第一特征提取器和第二特征提取器,所述将所述第一源端隐状态集合和所述第一目标端隐状态集合传输至所述质量评分子模型中,以控制所述评分质量子模型进行评分处理,得到所述目标译文对应的翻译质量评分,包括:
将所述第一源端隐状态集合包括的每个源端隐状态,以及所述第一目标端隐状态集合中包括的每个目标端隐状态进行拼接转置处理,并将拼接转置处理的结果作为所述第一特征提取器的输入矩阵;
对所述第一特征提取器的输入矩阵进行特征提取处理,得到所述第一特征提取器对应的第一输出矩阵;
对所述第一输出矩阵进行特征提取处理,得到所述第二特征提取器对应的第二输出矩阵;
基于所述第二输出矩阵获取所述翻译质量评价相关信息,并将所述翻译质量评价相关信息输入到评分函数中进行评分,得到所述目标译文对应的翻译质量评分。
6.如权利要求5所述的方法,其特征在于,所述对所述第一特征提取器的输入矩阵进行特征提取处理,得到所述第二特征提取器的输出矩阵,包括:
利用自注意机制对所述第一输出矩阵包括的矩阵元素进行关联矩阵元素查询,得到每个矩阵元素对应的关联矩阵元素;
将每个矩阵元素对应的关联矩阵元素组成关联矩阵,并对所述关联矩阵进行非线性处理,得到所述第二特征提取器对应的第二输出矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010772951.6/1.html,转载请声明来源钻瓜专利网。