[发明专利]基于语境迭代分析的汉译英机器翻译方法有效

专利信息
申请号: 201810282274.2 申请日: 2018-04-02
公开(公告)号: CN108491399B 公开(公告)日: 2021-08-06
发明(设计)人: 王路 申请(专利权)人: 上海杓衡信息科技有限公司
主分类号: G06F40/58 分类号: G06F40/58;G06F40/205;G06F40/253;G06F40/289
代理公司: 北京世誉鑫诚专利代理有限公司 11368 代理人: 孙国栋
地址: 200439 上海市宝山*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及基于语境迭代分析的汉译英机器翻译方法,包括:(1)判断是否有关键词库、专业术语库、汉语常见关联词句式库、汉语常见片语库、带有语境信息的单词库、统计机器翻译模型,若缺少任一个库或模型,进入步骤(2),反之,进入步骤(3);(2)构建1个关键词库、1个专业术语库、1个汉语常见关联词句式库、1个汉语常见片语库、1个带有语境信息的单词库和1个统计机器翻译模型;(3)接收待翻译的论文的中文摘要,并对其进行语境迭代翻译;(4)规整英文摘要;(5)输出英文摘要。本发明公开的基于语境迭代分析的汉译英机器翻译方法具有翻译领域广、准确率高等优点。
搜索关键词: 基于 语境 分析 汉译英 机器翻译 方法
【主权项】:
1.基于语境迭代分析的汉译英机器翻译方法,其特征在于,包括:(1)判断是否有关键词库、专业术语库、汉语常见关联词句式库、汉语常见片语库、带有语境信息的单词库、统计机器翻译模型,若缺少任一个库或模型,进入步骤(2),反之,进入步骤(3);(2)构建1个关键词库、1个专业术语库、1个汉语常见关联词句式库、1个汉语常见片语库、1个带有语境信息的单词库和1个统计机器翻译模型,构建完毕后进入步骤(3);(21)构建1个关键词库从各个学科领域的论文中文摘要中提取关键词,构建各个学科领域的关键词库,关键词库每个关键词包含汉语关键词、汉语关键词英语译文、汉语关键词所属学科三个字段;(22)构建1个专业术语库从各个学科领域的论文中文摘要中提取专业术词,构建各个学科领域的专业术语库,其中的每个专业术语包含汉语专业术语、汉语专业术语英语译文、汉语专业术语所属学科三个字段;(23)构建1个汉语常见关联词句式库从各个学科领域的论文中文摘要中分析常见的汉语关联词,形成汉语常见关联词句式库,其中的每个汉语常见关联词句式包含汉语常见关联词、汉语常见关联词句式、汉语常见关联词英语译文三个字段;(24)构建1个汉语常见片语库对各学科领域的论文中文摘要进行依存句法分析,统计出现频率较高的片语,并预先把片语中的特征词语预先翻译成英文,构建汉语常见片语库,其中的每个汉语常见片语包含汉语片语特征词、汉语片语模式、汉语片语特征词英语译文三个字段;(25)构建1个带有语境信息的单词库对各学科领域的论文中文摘要进行依存句法分析,统计出具有高频依存关系的词对,构建带有语境信息的单词库;带有语境信息的单词库包含汉语核心词、核心词语境、汉语核心词英语译文三个字段;(26)构建1个统计机器翻译模型借助联合国中英平行语料库,对MOSES统计机器翻译模型进行训练,学习短语对短语的翻译进而构建统计机器翻译模型;(3)接收待翻译的论文的中文摘要,并对其进行语境迭代翻译(31)对接收到的待翻译的论文的中文摘要进行篇章分析,确定待翻译的论文的中文摘要所属的学科领域,然后进入步骤(32);(32)依据步骤(23)创建的汉语常见关联词句式库,对接收到的待翻译的论文的中文摘要,进行句间语境分析,寻找带有常见的汉语关联词的句间语境;如果找到匹配的句间语境,则把句间语境中含有的汉语关联词替换成汉语关联词英语译文,待翻译的论文的中文摘要就转换成为中英文的混合形式,然后进入步骤(33);如果没有找到匹配的句间语境,然后进入步骤(33);(33)把经过步骤(32)处理的待翻译的论文的中文摘要分解成多个句子语境,然后进入步骤(34);(34)逐一翻译步骤(33)得到的句子语境,并将每一个句子语境的翻译结果返回到篇章语境中,然后进入步骤(35);(35)在篇章语镜中组合各个句子语境的翻译结果,形成英文摘要;(4)规整英文摘要(41)对步骤(35)生成的英文摘要,每一句的首字母变成大写形式,然后进入步骤(42);(42)删除步骤(41)处理的英文摘要中含有的多余的空格,并将标点符号替换成英文标点;(5)输出英文摘要。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海杓衡信息科技有限公司,未经上海杓衡信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810282274.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top