[发明专利]一种互联网网页翻译方法无效
申请号: | 201010271775.4 | 申请日: | 2010-09-03 |
公开(公告)号: | CN101916248A | 公开(公告)日: | 2010-12-15 |
发明(设计)人: | 俞晓华 | 申请(专利权)人: | 无锡诺宝科技发展有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/30 |
代理公司: | 无锡市大为专利商标事务所 32104 | 代理人: | 殷红梅 |
地址: | 214101 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 网页 翻译 方法 | ||
技术领域
本发明涉及一种互联网网页翻译方法,应用于互联网物联网信息科技领域。
背景技术
现有的互联网网页翻译技术,比如谷歌翻译,谷歌的网页翻译系统在当今互联网界得到了广泛的应用,主要用于粘贴文字翻译与网页整篇翻译。其各部分的连接关系较直观,基本部分有三部分。第一部分为空白框,供用户粘贴写入需翻译内容,或网页地址;第二部分为后台处理,对用户粘贴内容或网址网页全文翻译;第三部分为显示部分,显示由第二部分转来的翻译结果。谷歌翻译系统简单实用,其不足之处是对内容不加区分整块翻译返回,对较长文字段的翻译,由于各语种语序习惯不同,意思经常会杂乱叠加或意思失真。特别是对于有规范化内容结构的网页,如电子商务网站对产品的介绍,许多网页都是一种框架结构,通常框架(Frame)的内容是不变的,而具体的内容(Content)在变,这时会产生重复翻译。
发明内容
本发明针对目前自动翻译存在的问题,提供一种互联网网页翻译方法,设计了一个框架与内容分离的翻译系统以提高自动翻译系统的准确率与效率。
本发明对网页从一种语言到另一种语言的翻译,尤其对于有规范化内容结构的网页,如电子商务网站对产品的介绍提供技术方案,步骤如下:
A、 对网页页面进行分析,将页面文本分离为框架文本与内容文本;
B、 对框架文本只译一次,原文存储于第一文本,译文存储于第二文本;
C、 对内容文本,在数据库中建立两个表,分别为原文语言表与待译语言表;
D、 读取具体的网页内容文本,将内容文本的每个单元存储于原文语言表里的对应项;
E、 对于原文语言表里填进的内容一一翻译,将翻译结果填入待译语言表里的对应项;
F、 第一文本通过数据库连接从原文语言表中取一个记录,与网页格式框架结合,形成原文网页;第二文本通过数据库连接从待译语言表中取一个记录,与网页格式框架结合,形成译文网页。
所述第一文本和第二文本结构上一一对应。
所述第一文本和第二文本都有数据库连接机制,能够从所述原文语言表与待译语言表中取有同样序列号的记录。
所述原文语言表与待译语言表是数据库里预先设计好的两个表,具有相同结构,对每一记录有独特序列号。所述原文语言表与待译语言表的序列号在原文语言表中为自动递加产生,待译语言表中是在根据原文语言表中内容做对应翻译时复制所得。
分离框架文本与内容文本时,将页面文本中内容单元的属性名称作为框架文本,内容单元的具体内容作为内容文本。
本发明的优点是:
1、因为各语种语序、用词多义等特点,语言自动翻译是很难准确的,对有规范格式与内容的信息分框架与内容分别处理,将对一般全文翻译法从意义的传达上将更准确,以减少自动翻译系统的张冠李戴,尤其对有规范格式的文本信息。
2、如前所述,分框架与内容后,框架仅需翻译一次,提高了效率。
附图说明
图1是本发明原理示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。本发明应用了现代信息领域的软件技术、数据库技术与互联网技术。应用于不同语言间翻译时更快、更准确、更有效地完成信息的转译,尤其适用于有规范各式与内容的信息个体。
本发明可用于互联网系统,也可用于其它自动翻译系统,尤其适用于有规范格式与内容的信息,比如电子商务系统中对产品的介绍,将属性名称与内容分开处理,比如,“商品对象”、“购货方式”等等关键词属于属性名称,是框架,而其属性内容,如“全球”、“厂家直销”等是可变内容,一旦内容有变,被置换,即会产生新的一个产品介绍。根据此特点,采用本发明所述方法的翻译系统对框架内容分别处理,框架只需翻译一次,存于框架翻译结果存贮器,内容根据不用产品,每个都需要根据原语种再译,然后由结果合成器把框架结果与内容结果结合起来展示给用户。
如图1所示结构,本发明所述方法已成功应用于一新型电子商务系统的语言翻译,总体方案是是将属性内容置于预先设计好的数据库表格内。有一网页用户界面与此表格相连,供翻译者填入或修改内容部分翻译结果。框架属性被预译则置于翻译结果合成器中,合成器另可从数据库中调用内容部分翻译结果的一个记录,经对应合成,产生结果传于最终用户界面。框架与内容分别翻译流程,图1中标号对应于以下步骤。
例如一组规范结构的网页的文本其中一页包括以下内容:
商品名 针织内衣圆领情侣套装
商品对象 大陆 港澳台地区 北美 全球
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡诺宝科技发展有限公司,未经无锡诺宝科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010271775.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:经由常规通信信道的快速物品认证
- 下一篇:存储器装置与存储器控制方法