[发明专利]校正术语对的自动定位方法、装置、电子设备及存储介质在审
申请号: | 202010883171.9 | 申请日: | 2020-08-28 |
公开(公告)号: | CN111985254A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 周玉;邓彪;李小青;翟飞飞;刘鹏;韩延超 | 申请(专利权)人: | 北京中科凡语科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/226;G06F40/194;G06F40/189 |
代理公司: | 北京庚致知识产权代理事务所(特殊普通合伙) 11807 | 代理人: | 韩德凯;李伟波 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 校正 术语 自动 定位 方法 装置 电子设备 存储 介质 | ||
1.一种校正术语对的自动定位方法,其特征在于,包括:
S1、获得源语言语句的机器翻译结果,以及对所述机器翻译结果进行校正后的校正翻译结果;
S2、对所述机器翻译结果和所述校正翻译结果进行文本对比,获得用于定位至少一个校正术语对中每个校正术语对的至少一个候选查询词,以及对所述源语言语句和所述校正翻译结果进行词对齐,获得词对齐结果;以及
S3、对用于定位所述至少一个校正术语对中每个校正术语对的至少一个候选查询词和所述词对齐结果进行匹配,获得所述源语言语句及校正翻译结果中的至少一个校正术语对。
2.根据权利要求1所述的校正术语对的自动定位方法,其特征在于,所述校正翻译结果为译员校正后的校正翻译结果。
3.根据权利要求1所述的校正术语对的自动定位方法,其特征在于,每个校正术语对的至少一个候选查询词通过以下方法获得:
对所述机器翻译结果和所述校正翻译结果进行文本对比,获得所述校正翻译结果中的至少一个校正字符;以及
基于所述至少一个校正字符,使用滑动窗口的方法获得用于定位至少一个校正术语对中每个校正术语对的至少一个候选查询词。
4.根据权利要求3所述的校正术语对的自动定位方法,其特征在于,所述校正字符包括增加字符和/或删除字符。
5.根据权利要求1所述的校正术语对的自动定位方法,其特征在于,对所述源语言语句和所述校正翻译结果进行词对齐,获得词对齐结果,包括:
SS1、将源语言语句和所述校正翻译结果即目标语言语句组成句对,分别对所述源语言语句以及所述目标语言语句进行分词;
SS2、使用专业领域词典对所述分词后的句对中的单词进行对齐,获得专业领域词典能够对齐的单词对,作为词典对齐结果;
SS3、对所述源语言语句中的每个词与所述目标语言语句中的每个词进行正向对齐,获得正向对齐能够对齐的单词对,作为正向对齐结果;
SS4、对于步骤SS3中未能够正向对齐的词进行反向对齐,获得反向对齐能够对齐的单词对,作为反向对齐结果;以及
SS5、将词典对齐结果、正向对齐结果以及反向对齐结果作为初级对齐结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科凡语科技有限公司,未经北京中科凡语科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010883171.9/1.html,转载请声明来源钻瓜专利网。