[发明专利]语用机器翻译方法在审
申请号: | 201310624188.2 | 申请日: | 2013-11-30 |
公开(公告)号: | CN104679735A | 公开(公告)日: | 2015-06-03 |
发明(设计)人: | 赵会军 | 申请(专利权)人: | 赵会军 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 无 | 代理人: | 无 |
地址: | 050051 河北省石家庄市新华区*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 方法 | ||
1.语用机器翻译方法如下:
(1)信息接收窗口接收源语言信息;将源语言信息导入源语言预处理模块;
(2)源语言预处理模块对源语言进行格式预处理,使之符合规范的源语言格式;将处理后的标准格式源语言导入翻译引导模块;
(3)翻译引导模块将源语言初步切分成句子;先引入标点符号库和语言特殊标记库,以符合自然语用规则的句号、问号、感叹号、分号、空行等作为切分依据;将源语言初步切分成为单句,顺序导入翻译主模块;
(4)翻译主模块对句子进行翻译处理;主模块调入各种子模块,然后导入字符串标记处理模块;
(5)字符串标记处理模块对字符串进行初步分析,确定原句的时间、地点、人物等事件信息,并标注;将标注信息传递给句子切分模块;
(6)句子切分模块根据句子的关联信息对单句进行再切分;根据切分方法的两个核心点,将句子切分成几个子句;然后导入排序模块;
(7)排序模块对子句进行重新排序;根据切分依据的不同对子句进行重排序;将排序结果导入到翻译对齐模块;
(8)翻译对齐模块将重排序结果进行目标语对齐;根据子句的不同类型从语言库调用不同的对齐词语;然后导入目标语规范处理模块;
(9)目标语规范处理模块预先调入目标语使用规则库,根据目标语的表达规范将对齐的结果进行规范化处理,得到符合目标语言表达习惯的翻译结果;然后导入结果输出窗口;
(10)结果输出窗口将结果输出到应用终端。
2.权利要求1中语用的概念范围指的是:语用学的各个领域包括如语境、指示语、预设、语言礼貌、会话含意、关联理论、话语连贯、言语行为理论、会话分析、认知语用、顺应论等。
3.按照权利要求1的翻译方法,步骤(4)所述各种子模块包括:语言切分程序包、词性标记程序包、基本语料库、基本词典库、固定词语库、语用知识库、短语表等语言库。
4.按照权利要求1的翻译方法,步骤(4)所述两个核心点指的是:一是按照原文的线性排列进行切分,完全不同于目前流行的乔姆斯基的NP/VP语言树结构划分的方式;二就是通过设置多个语言子库,与原文进行交叉定位并提取关联信息,以此为依据对原文进行切分;切分的依据是动态变化的,可以适应千变万化的语言结构;一个句子中的切分依据在另一个句子中可能就不是切分依据。
5.按照权利要求1的翻译方法,步骤(7)所述重排序是:通过分析源语言句子的每个细小单元之间的关联关系将句子重新组合成目标语言的关联关系,并且这种关联关系是可以计算的;关联关系根据源语言细小单元之间的时间、空间、人物、事件以及相互之间的逻辑关系进行判断,每个细小单元的重新组合根据目标语的时间、空间、人物、事件以及相互之间的逻辑关系进行排序。
6.按照权利要求1的翻译方法,步骤(8)所述语言库包括:基本语料库、基本词典库、固定词语库、语用知识库、短语表等。
7.按照权利要求1的翻译方法,步骤(9)所述目标语规范处理是指:进行目标语的二次处理,二次处理主要解决语言的平顺度问题,通过增减非实质意义词汇如助词、介词、连词、副词等的方法来实现目标语的规范化。
8.语用翻译方法包括信息接收窗口、源语言预处理模块、翻译引导模块、翻译主模块、各种子模块、字符串标记处理模块、句子切分模块、排序模块、翻译对齐模块、目标语规范模块、结果输出窗口等模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赵会军;,未经赵会军;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310624188.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种获取实例占用内存的方法及装置
- 下一篇:计算机系统