[发明专利]预处理文本的方法以及用于执行该方法的预处理系统在审
申请号: | 201680001271.6 | 申请日: | 2016-06-21 |
公开(公告)号: | CN107148624A | 公开(公告)日: | 2017-09-08 |
发明(设计)人: | 文炼国;李东炫;蔡承勋;尹熙花 | 申请(专利权)人: | 电子部品研究院 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/28 |
代理公司: | 北京三友知识产权代理有限公司11127 | 代理人: | 李辉,刘久亮 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了一种能够通过用标准语言替换包含在翻译目标文本中的术语的预处理来提高机械翻译的准确性的预处理文本的方法以及执行该方法的预处理系统。所述文本预处理系统包括替换术语数据库,所述替换术语数据库存储替换术语;以及处理器,所述处理器执行预处理工具,所述预处理工具对所述输入文本进行预处理并且输出与所述输入文本的语言相同的语言的文本,其中,所述预处理工具识别所述输入文本中的替换目标术语,并且输出所识别的替换目标术语被替换术语替换的文本。 | ||
搜索关键词: | 预处理 文本 方法 以及 用于 执行 系统 | ||
【主权项】:
一种在将输入文本翻译成另一种语言的文本之前对所述输入文本进行预处理的文本预处理系统,所述文本预处理系统包括:替换术语数据库,所述替换术语数据库存储替换术语;以及处理器,所述处理器执行预处理工具,所述预处理工具对所述输入文本进行预处理并且输出与所述输入文本的语言相同的语言的文本,其中,所述预处理工具包括:语素分析单元,所述语素分析单元以语素为单位将所述输入文本进行分隔,并且确定经分隔的语素的语音部分;术语识别单元,所述术语识别单元识别经分隔的语素是否与替换目标术语对应;替换术语搜索单元,如果经分隔的语素与替换目标术语对应,则所述替换术语搜索单元基于术语是否对应在所述替换术语数据库中搜索与所述替换目标术语对应的替换术语;以及构造分析单元,当基于术语是否对应在所述替换术语数据库中不存在对应的替换术语时,所述构造分析单元对所述输入文本的构造进行分析并且估计不存在所述替换术语的术语的含义,其中,所述替换术语搜索单元基于构造分析结果来搜索与估计的含义对应的替换术语。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子部品研究院,未经电子部品研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201680001271.6/,转载请声明来源钻瓜专利网。
- 上一篇:发动机
- 下一篇:照明装置及其控制方法