[发明专利]一种自动更正部分文字的方法-由英文词性判断有效
申请号: | 201710963826.1 | 申请日: | 2017-10-17 |
公开(公告)号: | CN107590132B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 王莲 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/284;G06F40/289;G06F40/232;G06F40/47 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430073 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 更正 部分 文字 方法 英文 词性 判断 | ||
本发明避免了采用计算机判断中文词汇是否为定语/状语/补语的难题,创造性的将翻译文档句子和原文句子对齐,利用原文句子中对应的语料词汇的词性来做出判断。具体来说,原文为英文,翻译文档为中文时,由于英文单词的词汇可以通过语料库/分词工具/词汇库等其他第三方工具准确确定其词性,例如,形容词或者动词,然后结合对应的语料词汇的词性连接属性,即可得出相应的翻译文档中应当采用“的、地、得”的哪一种。
技术领域
本发明属于文档处理技术领域,尤其涉及一种自动更正部分文字的方法。
背景技术
在中文语法中,“的”、“得”、“地”用作虚词时,是连接文章中词与词,字与字之间的重要桥梁,在各种书面表达中使用十分广泛。然而,很多人并没有清楚的知晓三者的区别,通常相互混用,甚至全部用“的”代替。
但是,在逻辑性很强的论述性、说明性语言中,如法律条款、学术论著、外文译著、教科书等情形中,必须严格区分三者的使用情况,才能保证书面语言的精确。特别是将上述相关的外文材料,例如法律条款/新闻稿/公文,翻译成中文时,为了保证原文的准确性,更是不能混淆。
但是,当前大多数翻译人员在翻译时并没有注意到这一问题,经常出现翻译错误,或者随意的给出“的”、“得”、“地”的某一种翻译,而没有兼顾原文的准确含义;另外,在翻译时如果一一准确推敲该采用哪一种表达,又会导致翻译效率低下,因此,译员也有可能选择翻译时不严格推敲,事后再校对的方法,但是这种方式并不能保证结果的准确性,同时也耗费译员精力。
简单来说,“的、地、得”在普通话里都读轻声“de”,但在书面语中有必要写成三个不同的字:在定语后面写作“的”,在状语后面写作“地”,在补语前写作“得”。这样做的好处,就是可使书面语言精确化。
虽然这一使用规则为语言学者所熟知,但是对于译员来说,其需要再给出中文句子翻译结果之后才能使用上述规则,在文档翻译量巨大的情形下,一一人工甄别是不现实的;另外,大部分翻译工作者不是严格掌握语法规则的研究人员,其注重的可能更多是实质内容本身,而不会重视这三个字的重要性;更重要的是,“的、地、得”只有在做虚词的时候才会出现上述情况,处于实词构成部分的“的、地、得”是不需要考虑上述问题的,因此,简单采用三字查找的方式,徒增工作量。
另外,即使知晓了上述“的、地、得”的使用规则,但是在中文语料中,对于所谓定语/状语/补语的定义,由于计算机并不能严格定义其特征,因此,无法直接将上述判断方法计算机流程化实现。
发明内容
为了解决文档中有关“的、地、得”错误使用的问题,本发明提供了一种自动更正方法。该方法首先定位出翻译文档中所有作为虚词使用的“的、地、得”,然后根据相应的规则,对其进行更正。所述方法以翻译文档原有的原文文档为基础进行词性判断,从而能够在计算机上流程化实现。
该方法具体描述如下
一种自动更正部分文字的方法,用于更正翻译文档中的特定文字,所述方法包括如下步骤:
S1. 将所述翻译文档与原文文档进行双语语料对齐;
S2. 提取所述翻译文档中包含所述特定文字的句子,将其依序存储到序列表中;
S3. 从所述序列表中依序读取句子作为当前待更正句子,获取当前待更正句子中的所述特定文字,以及该特定文字前的第一预定数量个文字和该特定文字后的第二预定数量个文字;
S4. 根据所述第一预定数量个文字和该特定文字的第一组合特性,和/或,所述第二预定数量个文字和该特定文字的第二组合特性,判断所述特定文字是否需要进行更正;
S5. 如果需要进行更正,则查找当前待更正句子在原文文档中对应的语料句子原文,并将二者进行语料对齐,然后按照预定策略对所述特定文字进行更正;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710963826.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种PCB板的线路形成方法
- 下一篇:一种线路板排线机构