[发明专利]中文地址的翻译方法及系统在审
申请号: | 201510658426.0 | 申请日: | 2015-10-12 |
公开(公告)号: | CN105224525A | 公开(公告)日: | 2016-01-06 |
发明(设计)人: | 刘帅;韩子成;祁劢;李锡铭 | 申请(专利权)人: | 携程计算机技术(上海)有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;王聪 |
地址: | 200335 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中文 地址 翻译 方法 系统 | ||
1.一种中文地址的翻译方法,其特征在于,所述翻译方法包括:
S1、预设特征词,将中文地址按照特征词划分为多个地址单元,每个地址单元均以特征词作为结尾;
S2、将每个地址单元中的非特征词翻译为拼音,并将每个地址单元中的特征词翻译为英文;
S3、将翻译后的地址单元调整顺序后输出。
2.如权利要求1所述的翻译方法,其特征在于,所述翻译方法还包括在S1之后且在S2之前执行以下步骤:
S11、检查每个地址单元的组成结构,若存在组成结构符合第一规则的待处理地址单元,则对所述待处理地址单元执行S12,若每个地址单元的组成结构均不符合第一规则,则执行S2;
S12、将所述待处理地址单元与相邻的地址单元连接,并重新划分地址单元。
3.如权利要求2所述的翻译方法,其特征在于,地址单元的组成结构包括以下几种:名称和特征词、名称和方位词及特征词、只包括特征词和只包括方位词及特征词;
所述第一规则为地址单元的组成结构为只包括特征词,或者只包括特征词和方位词;
S12包括将所述待处理地址单元与所述待处理地址单元的前一个地址单元或所述待处理地址单元的后一个地址单元连接,以形成一个新的地址单元。
4.如权利要求3所述的翻译方法,其特征在于,S12包括通过以下标准中的一种或几种衡量将所述待处理地址单元与所述前一个地址单元连接还是与所述后一个地址单元连接:
第一标准为,在所述待处理地址单元、所述前一个地址单元和所述后一个地址单元中,将所述待处理地址单元与所述前一个地址单元连接或与后一个地址单元连接后,剩余的地址单元的组成结构是否符合第一规则;
第二标准为,与所述待处理地址单元连接的地址单元的组成结构是否符合第一规则;
第三标准为,将所述待处理地址单元与所述前一个地址单元连接或与后一个地址单元连接后所形成的新的地址单元的名称的字符数是否多于一阈值;
第四标准为,若所述待处理地址单元为字母或数字,将所述待处理地址单元与后一个地址单元连接,以形成一个新的地址单元。
5.如权利要求4所述的翻译方法,其特征在于,S12通过打分机制计算将所述待处理地址单元与所述前一个地址单元连接的分数和将所述待处理地址单元与所述后一个地址单元连接的分数,若分数不同,则采用分数相对较高的连接方式形成新的地址单元,若分数相同,则将所述待处理地址单元与所述前一个地址单元连接形成新的地址单元。
6.如权利要求1至5中任意一项所述的翻译方法,其特征在于,所述翻译方法还包括在S1之后且在S2之前执行以下步骤:
T1、通过匹配地址词库,将地址单元拆分成一个或多个地址单元;
T2、检查拆分后的每个地址单元的组成结构,若存在组成结构符合第一规则的地址单元,则将拆分后的地址单元还原为拆分前,若每个地址单元的组成结构均不符合第一规则,则执行S2。
7.如权利要求6所述的翻译方法,其特征在于,所述翻译方法还包括在T2之后且在S2之前执行以下步骤:
T3、在通过T1和T2得到的且不包括特征词的地址单元中添加对应的特征词。
8.如权利要求6所述的翻译方法,其特征在于,T1包括:通过匹配地址词库,分别将前N个地址单元拆分成一个或多个地址单元,N为整数。
9.如权利要求1所述的翻译方法,其特征在于,S3包括以下内容中的一种:
将翻译后的地址按照逆序输出;
将翻译后的地址单元按照特征词由小到大的顺序排列后输出;
将地址单元按照特征词由大到小的顺序排序,再将翻译后的地址按照逆序输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510658426.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于海量视频的关注目标快速查询系统
- 下一篇:文档翻译难度评价方法和装置