[发明专利]一种自动更正部分文字的方法-由中文词性判断有效

专利信息
申请号: 201710963696.1 申请日: 2017-10-17
公开(公告)号: CN107729318B 公开(公告)日: 2021-04-20
发明(设计)人: 王莲 申请(专利权)人: 语联网(武汉)信息技术有限公司
主分类号: G06F40/232 分类号: G06F40/232
代理公司: 暂无信息 代理人: 暂无信息
地址: 430073 湖北省武汉市东湖开发区光谷软件*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自动 更正 部分 文字 方法 中文 词性 判断
【说明书】:

发明主要涉及对“的”、“得”、“地”三字的判断更正。译员在翻译完成稿件后,本方法将自动检查译员稿件中使用的“的”和“得”和“地”,根据规则,如果用错,会自动更正成正确的“的”或“得”或“地”。根据本发明提供的方法,首先检测出文档中所有包含“的”、“得”、“地”的句子,根据分词方法判断其属于实词还是虚词;属于实词的时候,直接跳过;否则,根据相关规则进行“的”、“得”、“地”的修正判断。采用本发明,可以提高翻译文档的表达准确性,避免现有技术中人工核实的效率低下问题。

技术领域

本发明属于文档处理技术领域,尤其涉及一种自动更正部分文字的方法。

背景技术

在中文语法中,“的”、“得”、“地”用作虚词时,是连接文章中词与词,字与字之间的重要桥梁,在各种书面表达中使用十分广泛。然而,很多人并没有清楚的知晓三者的区别,通常相互混用,甚至全部用“的”代替。

从语法研究上看,吕叔湘、朱德熙所著《语法修辞讲话》认为“的”兼职过多,负担过重,而力主“的、地、得”严格分工。50 年代以来的诸多现代汉语论著和教材,一般也持这一主张。

从书面语中的使用情况看,“的”与“地”、“得”的分工也日趋明确,例如,在逻辑性很强的论述性、说明性语言中,如法律条款、学术论著、外文译著、教科书等情形中,必须严格区分三者的使用情况,才能保证书面语言的精确。特别是将上述相关的外文材料,例如法律条款/新闻稿/公文,翻译成中文时,为了保证原文的准确性,更是不能混淆。无论从新闻出版界奉为标准的《现代汉语词典》“的”“得”“地”词条来看,还是《人民日报》、新华社和正规出版社的实践来看,都是严格区分的。“的”、“得”、“地”三字的乱用,只会导致译文最终贻笑大方。

但是,当前大多数翻译人员在翻译时并没有注意到这一问题,经常出现翻译错误,或者随意的给出“的”、“得”、“地”的某一种翻译,而没有兼顾原文的准确含义;另外,在翻译时如果一一准确推敲该采用哪一种表达,又会导致翻译效率低下,因此,译员也有可能选择翻译时不严格推敲,事后再校对的方法,但是这种方式并不能保证结果的准确性,同时也耗费译员精力。

简单来说,“的、地、得”在普通话里都读轻声“de”,但在书面语中有必要写成三个不同的字:在定语后面写作“的”,在状语后面写作“地”,在补语前写作“得”。这样做的好处,就是可使书面语言精确化。

虽然这一使用规则为语言学者所熟知,但是对于译员来说,其需要再给出中文句子翻译结果之后才能使用上述规则,在文档翻译量巨大的情形下,一一人工甄别是不现实的;另外,大部分翻译工作者不是严格掌握语法规则的研究人员,其注重的可能更多是实质内容本身,而不会重视这三个字的重要性;更重要的是,“的、地、得”只有在做虚词的时候才会出现上述情况,处于实词构成部分的“的、地、得”是不需要考虑上述问题的,因此,简单采用三字查找的方式,徒增工作量。

另外,即使知晓了上述“的、地、得”的使用规则,但是在中文语料中,对于所谓定语/状语/补语的定义,由于计算机并不能严格定义其特征,无法精确识别,因此,无法直接将上述判断方法计算机流程化实现。

发明内容

为了解决文档中有关“的、地、得”错误使用的问题,本发明提供了一种自动更正方法。该方法首先定位出文档中所有作为虚词使用的“的、地、得”,然而根据相应的规则,对其进行更正。

所述方法可以采用计算机技术全自动的实现。根据处理思路的不同,存在两种不同的更正方法。

在第一方面,本发明提供的一种自动更正部分文字的方法,包括如下步骤:

S1. 对待更正文档进行分句处理,得到多个句子;

S2. 提取包含所述特定文字的句子,将其依序存储到序列表中;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710963696.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top