[发明专利]网页翻译方法和系统有效
申请号: | 201510330503.X | 申请日: | 2015-06-15 |
公开(公告)号: | CN104881406B | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 李锡铭;韩子成;祁劢;刘帅 | 申请(专利权)人: | 上海携程商务有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30 |
代理公司: | 上海弼兴律师事务所31283 | 代理人: | 薛琦,王聪 |
地址: | 200335 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网页 翻译 方法 系统 | ||
1.一种网页翻译方法,其特征在于,待翻译网页的内容包括若干文字显示区域,每个所述文字显示区域对应一个标签,所述网页翻译方法包括以下步骤:
S1、获取所述待翻译网页的每一标签的文字显示区域,提取所述标签中的待处理文字;
S2、获取每一标签的文字显示区域的大小;
S3、按每一标签翻译所述待处理文字,以生成目标语言的翻译文字,每一标签的翻译文字所占的空间小于或等于该标签的文字显示区域的大小;
S4、生成目标语言网页,所述目标语言网页的标签的布局同所述待翻译网页一致,所述目标语言网页中每一标签的文字均采用对应的所述翻译文字。
2.如权利要求1所述的网页翻译方法,其特征在于,S3包括以下步骤:
S31、按每一标签翻译所述待处理文字,生成若干组字符长度不同的待选翻译文字;
S32、从所述若干组待选翻译文字中选取一组所占的空间小于或等于该标签的文字显示区域的大小的待选翻译文字作为所述翻译文字。
3.如权利要求2所述的网页翻译方法,其特征在于,S32包括以下步骤:
S321、逐一调整所述待选翻译文字的字体大小,以生成比对应标签的待处理文字的字体大一号、相同和小一号的待选翻译字体文字;
S322、从S321中生成的字号不同的所述待选翻译字体文字中选取一组占的空间小于或等于该标签的文字显示区域的大小且最接近该标签的文字显示区域的大小的所述待选翻译字体文字作为所述翻译文字。
4.如权利要求1至3中任一项所述的网页翻译方法,其特征在于,S3包括以下步骤:
S31’、采用分词算法分解所述待处理文字,以生成若干个待翻译元素词;
S32’、在翻译历史词库中查找每个待翻译元素词匹配的目标元素词,若找不到,则调用第三方翻译引擎进行翻译,以得到目标元素词,并将翻译结果增加到所述翻译历史词库中,所述翻译历史词库用于存放所有的历史翻译结果;
S33’、以S32’中的目标元素词将所述待处理文字翻译生成所述翻译文字。
5.如权利要求4所述的网页翻译方法,其特征在于,S31’包括以下步骤:
S31’1、以历史分词词库为基础对所述待处理文字进行分词;
S31’2、以常用传统分词词库为基础对S31’1中未分解成功的所述待处理文字的剩余部分进行分词,并将分词结果增加到所述历史分词词库中,所述历史分词词库用于存放所有的历史待翻译元素词;
S31’3、以S31’1的分词结果和S31’2的分词结果共同生成待翻译元素词。
6.如权利要求4所述的网页翻译方法,其特征在于,S31’中所述分词算法为正向最大匹配算法、歧义消除规则算法或双向最大匹配算法。
7.一种网页翻译系统,其特征在于,包括:
文字提取模块,用于获取待翻译网页的每一标签的文字显示区域,提取标签中的待处理文字;
区域大小获取模块,用于获取每一标签的文字显示区域的大小;
文字翻译模块,用于按每一标签翻译所述待处理文字,以生成目标语言的翻译文字,每一标签的翻译文字所占的空间小于或等于该标签的文字显示区域的大小;
网页生成模块,用于生成目标语言网页,所述目标语言网页的标签的布局同所述待翻译网页一致,所述目标语言网页中每一标签的文字均采用对应的所述翻译文字。
8.如权利要求7所述的网页翻译系统,其特征在于,所述文字翻译模块包括:
待选翻译文字生成模块,用于按每一标签翻译所述待处理文字,生成若干组字符长度不同的待选翻译文字;
文字选取模块,用于从所述若干组待选翻译文字中选取一组所占的空间小于或等于该标签的文字显示区域的大小的待选翻译文字作为所述翻译文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海携程商务有限公司,未经上海携程商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510330503.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据展示方法和系统
- 下一篇:基于联想网络的语义相关性计算方法