[发明专利]中文地址的翻译方法及系统在审
申请号: | 201510658426.0 | 申请日: | 2015-10-12 |
公开(公告)号: | CN105224525A | 公开(公告)日: | 2016-01-06 |
发明(设计)人: | 刘帅;韩子成;祁劢;李锡铭 | 申请(专利权)人: | 携程计算机技术(上海)有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;王聪 |
地址: | 200335 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中文 地址 翻译 方法 系统 | ||
技术领域
本发明涉及一种中文地址的翻译方法及系统。
背景技术
目前,很多翻译引擎都可以将中文翻译为英文,但是这些翻译引擎在将中文地址翻译为英文时,普遍存在着翻译不准确的问题,出现这种问题的主要原因在于,现有翻译引擎在进行翻译时通过都是基于统计数据,也就是说,翻译引擎先收集大量中英文对照的地址,然后在翻译时,从收集到的地址中查找需要翻译的中文地址,再找到与之对应的英文地址作为翻译结果。由于很难保证收集的数据的准确性,所以就更难保证翻译结果的准确性。
发明内容
本发明要解决的技术问题是为了克服现有的翻译引擎在翻译地址时不准确的缺陷,提供一种能够准确翻译的中文地址的翻译方法及系统。
本发明是通过以下技术方案解决上述技术问题的:
本发明提供一种中文地址的翻译方法,其特点是,所述翻译方法包括:
S1、预设特征词,将中文地址按照特征词划分为多个地址单元,每个地址单元均以特征词作为结尾;
S2、将每个地址单元中的非特征词翻译为拼音,并将每个地址单元中的特征词翻译为英文;
S3、将翻译后的地址单元调整顺序后输出。
其中,特征词可以包括表示地址等级的词,如省、市、区、县、路、镇、村、花园;还可以包括数字和字母等,经过步骤S1中文地址被划分成多个地址单元,如地址××省××市××县划分后有3个地址单元,分别为××省、××市和××县。
本技术方案通过将中文地址进行划分并逐一进行翻译,得到准确的翻译结果,并且考虑到中文和英文在地址的表达习惯的不同,本技术方案还自动将翻译好的地址调整为符合英文表达习惯的地址,进一步提高了翻译结果的准确性。
较佳地,所述翻译方法还包括在S1之后且在S2之前执行以下步骤:
S11、检查每个地址单元的组成结构,若存在组成结构符合第一规则的待处理地址单元,则对所述待处理地址单元执行S12,若每个地址单元的组成结构均不符合第一规则,则执行S2;
S12、将所述待处理地址单元与相邻的地址单元连接,并重新划分地址单元。
由于第一次划分的地址单元可能存在错误,所以本技术方案通过预设的第一规则检查每个地址单元的组成结构,在小范围内对组成结构符合第一规则的待处理地址单元进行调整,进一步保证后续翻译结果的准确性。
较佳地,地址单元的组成结构包括以下几种:名称和特征词、名称和方位词及特征词、只包括特征词和只包括方位词及特征词;
所述第一规则为地址单元的组成结构为只包括特征词,或者只包括特征词和方位词;
S12包括将所述待处理地址单元与所述待处理地址单元的前一个地址单元或所述待处理地址单元的后一个地址单元连接,以形成一个新的地址单元。
考虑到一些地名可能就是由几个特征词组成的,为了防止这些地名被误分为几个地址单元,本技术方案将被误分的地址单元重新连接起来,进一步提高了翻译结果的准确性。
较佳地,S12包括通过以下标准中的一种或几种衡量将所述待处理地址单元与所述前一个地址单元连接还是与所述后一个地址单元连接:
第一标准为,在所述待处理地址单元、所述前一个地址单元和所述后一个地址单元中,将所述待处理地址单元与所述前一个地址单元连接或与后一个地址单元连接后,剩余的地址单元的组成结构是否符合第一规则;
第二标准为,与所述待处理地址单元连接的地址单元的组成结构是否符合第一规则;
第三标准为,将所述待处理地址单元与所述前一个地址单元连接或与后一个地址单元连接后所形成的新的地址单元的名称的字符数是否多于一阈值;
第四标准为,若所述待处理地址单元为字母或数字,将所述待处理地址单元与后一个地址单元连接,以形成一个新的地址单元。
较佳地,S12通过打分机制计算将所述待处理地址单元与所述前一个地址单元连接的分数和将所述待处理地址单元与所述后一个地址单元连接的分数,若分数不同,则采用分数相对较高的连接方式形成新的地址单元,若分数相同,则将所述待处理地址单元与所述前一个地址单元连接形成新的地址单元。
若采用上述标准,则:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510658426.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于海量视频的关注目标快速查询系统
- 下一篇:文档翻译难度评价方法和装置