[发明专利]一种自动更正部分文字的方法-由中文词性判断有效
申请号: | 201710963696.1 | 申请日: | 2017-10-17 |
公开(公告)号: | CN107729318B | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 王莲 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430073 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 更正 部分 文字 方法 中文 词性 判断 | ||
本发明主要涉及对“的”、“得”、“地”三字的判断更正。译员在翻译完成稿件后,本方法将自动检查译员稿件中使用的“的”和“得”和“地”,根据规则,如果用错,会自动更正成正确的“的”或“得”或“地”。根据本发明提供的方法,首先检测出文档中所有包含“的”、“得”、“地”的句子,根据分词方法判断其属于实词还是虚词;属于实词的时候,直接跳过;否则,根据相关规则进行“的”、“得”、“地”的修正判断。采用本发明,可以提高翻译文档的表达准确性,避免现有技术中人工核实的效率低下问题。
技术领域
本发明属于文档处理技术领域,尤其涉及一种自动更正部分文字的方法。
背景技术
在中文语法中,“的”、“得”、“地”用作虚词时,是连接文章中词与词,字与字之间的重要桥梁,在各种书面表达中使用十分广泛。然而,很多人并没有清楚的知晓三者的区别,通常相互混用,甚至全部用“的”代替。
从语法研究上看,吕叔湘、朱德熙所著《语法修辞讲话》认为“的”兼职过多,负担过重,而力主“的、地、得”严格分工。50 年代以来的诸多现代汉语论著和教材,一般也持这一主张。
从书面语中的使用情况看,“的”与“地”、“得”的分工也日趋明确,例如,在逻辑性很强的论述性、说明性语言中,如法律条款、学术论著、外文译著、教科书等情形中,必须严格区分三者的使用情况,才能保证书面语言的精确。特别是将上述相关的外文材料,例如法律条款/新闻稿/公文,翻译成中文时,为了保证原文的准确性,更是不能混淆。无论从新闻出版界奉为标准的《现代汉语词典》“的”“得”“地”词条来看,还是《人民日报》、新华社和正规出版社的实践来看,都是严格区分的。“的”、“得”、“地”三字的乱用,只会导致译文最终贻笑大方。
但是,当前大多数翻译人员在翻译时并没有注意到这一问题,经常出现翻译错误,或者随意的给出“的”、“得”、“地”的某一种翻译,而没有兼顾原文的准确含义;另外,在翻译时如果一一准确推敲该采用哪一种表达,又会导致翻译效率低下,因此,译员也有可能选择翻译时不严格推敲,事后再校对的方法,但是这种方式并不能保证结果的准确性,同时也耗费译员精力。
简单来说,“的、地、得”在普通话里都读轻声“de”,但在书面语中有必要写成三个不同的字:在定语后面写作“的”,在状语后面写作“地”,在补语前写作“得”。这样做的好处,就是可使书面语言精确化。
虽然这一使用规则为语言学者所熟知,但是对于译员来说,其需要再给出中文句子翻译结果之后才能使用上述规则,在文档翻译量巨大的情形下,一一人工甄别是不现实的;另外,大部分翻译工作者不是严格掌握语法规则的研究人员,其注重的可能更多是实质内容本身,而不会重视这三个字的重要性;更重要的是,“的、地、得”只有在做虚词的时候才会出现上述情况,处于实词构成部分的“的、地、得”是不需要考虑上述问题的,因此,简单采用三字查找的方式,徒增工作量。
另外,即使知晓了上述“的、地、得”的使用规则,但是在中文语料中,对于所谓定语/状语/补语的定义,由于计算机并不能严格定义其特征,无法精确识别,因此,无法直接将上述判断方法计算机流程化实现。
发明内容
为了解决文档中有关“的、地、得”错误使用的问题,本发明提供了一种自动更正方法。该方法首先定位出文档中所有作为虚词使用的“的、地、得”,然而根据相应的规则,对其进行更正。
所述方法可以采用计算机技术全自动的实现。根据处理思路的不同,存在两种不同的更正方法。
在第一方面,本发明提供的一种自动更正部分文字的方法,包括如下步骤:
S1. 对待更正文档进行分句处理,得到多个句子;
S2. 提取包含所述特定文字的句子,将其依序存储到序列表中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710963696.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种微阵列式偏振光罗盘的定向方法
- 下一篇:定位装置和系统