[发明专利]应用行动通信设备翻译影像文字的方法及其系统有效
申请号: | 200610160825.5 | 申请日: | 2006-11-30 |
公开(公告)号: | CN101193158A | 公开(公告)日: | 2008-06-04 |
发明(设计)人: | 陈柏戎;陈佩君;王科翔;郭建春 | 申请(专利权)人: | 财团法人工业技术研究院 |
主分类号: | H04M3/42 | 分类号: | H04M3/42;H04Q7/32;H04L12/16 |
代理公司: | 北京律诚同业知识产权代理有限公司 | 代理人: | 梁挥;徐金国 |
地址: | 中国台*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用 行动 通信 设备 翻译 影像 文字 方法 及其 系统 | ||
技术领域
本发明涉及一种应用行动通信设备翻译影像文字的方法及其系统,尤其涉及一种通过前端行动通信装置取像、传输至后端服务器进行翻译影像为文字说明并回传文字说明至前端的方法及其系统。
背景技术
目前手机(Mobile Phone)或个人数字助理(Personal Digital Assistant,PDA)虽然提供了翻译功能,但由于手机与PDA打字或手写输入的速度仍然不够理想,或是接口不够方便,甚至手机或PDA的系统内根本没有所要翻译的国家的输入界面,因此应用手机或PDA进行翻译的使用率偏低,而翻译机和计算机的输入较方便,但需要翻译的时候往往身边不一定带着翻译机或计算机,尤其在户外。因此目前有业者提出经由网络架构,由前端的行动装置提供特定标记的影像并利用通信网路将其影像回传后端处理的技术,如图1所示,美国专利说明书US66522889公开揭露有一利用前端的行动通信装置10,通过前端行动通信装置10所设的相机11取得一所在地特定的地理区域影像,并通过一整体封包无线电服务(General Packet Radio Service,GPRS)网络12的无线通信网路传输,经因特网存取13进入一因特网14中,再由与因特网14联结的光学字符辨识(Optical Character Reader,OCR)服务器15转换影像为文字型态并与同样联机于因特网14上的定位服务器16内所储存的地理区域数据库对比之,再把正确的对比位置传回至行动通信装置10上。
虽然上述技术提出经由网络传送处理影像的架构,但此技术仅用于对前端撷取特定的地理位置影像至后端加以辨识坐标来定位,而无法具有翻译前端任意的语言文字的功能。
发明内容
本发明所要解决的技术问题在于提供一种由前端行动通信装置取像,并送经后端服务器辨识并翻译影像文字再回传的应用行动通信设备翻译影像文字的方法。本发明所要解决的另一技术问题在于提供一种前端取像、后端的辨识翻译以及供前后端联机的行动网络的应用行动通信设备翻译影像文字的系统。
本发明解决其应用行动通信设备翻译影像文字的方法所采用的技术手段如下:自行动通信装置撷取一含影像文字的数字影像,再传输数字影像至一后端的服务器中,由服务器应用光学文字辨识程序辨识数字影像为一对应文字,并由服务器应用翻译程序翻译对应文字为一相同或不同语言的文字说明内容,再传输说明内容回到行动通信装置中,以显示说明内容于行动通信装置。
上述发明的进一步改良,是在辨识数字影像中文字时,预先以影像处理程序找出文字影像区域,以提高后续辨识正确率。也可进一步提供一文字群组分类程序将文字影像区域区分为多个对应字母、文字或词组的群组。
上述发明的进一步改良,可在行动通信装置撷取影像时,提供边界标记显示于显示接口中,以翻译最接近显示接口中央的影像文字,或是由使用者于显示接口中手动地加入标记后,将标记位置信息连同所撷取的影像一同传输至后端的服务器中,计算多个群组中最接近标记位置的群组,再进行辨识及翻译作业。
为实现上述目的,本发明还提供一种应用行动通信设备翻译影像文字的系统,包括:一无线通信网路;一行动通信装置与该无线通信网路连通,其具有一影像撷取单元以及一显示单元,该影像撷取单元用以撷取一含有影像文字的数字影像,并传输至该无线通信路上;以及一服务器与该无线通信网路连通,其具有一影像处理程序、一文字群组分类程序、一文字辨识程序和一翻译程序,可对该行动通信装置上传的该数字影像进行影像文字区域识别、文字群组分类、文字辨识与翻译处理,产生一说明内容,并经该无线通信网路回传该说明内容至该行动通信装置,由该显示单元显示。
本发明通过前端的行动通信装置拍下欲翻译的影像,传输到后端的服务器辨识翻译,再将其结果回传至行动通信装置呈现。由于目前行动无线上网的速度已越来越快,等待传输的时间不需太久,而且行动装置上的取像装置分辨率也快速提高,故影像中的文字或词组可获得有效的辨识,另整合目前已有的稳定有效的影像背景处理技术、影像文字辨识技术及翻译技术,可将服务器的强大数据储存及运算处理能力与行动通信装置的方便性、机动性相结合,以令使用者能随时随地更方便的进行翻译,而不需手动按键输入内容,特别是对于一些无法于行动通信装置直接输入的其它国家的语言(行动通信装置无提供该国语文输入法的情形),也可有效地进行翻译作业。
附图说明
图1为现有技术的辨识行动通信装置的位置的系统方块图;
图2为本发明应用行动通信设备翻译影像文字的系统实施例的系统方块图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人工业技术研究院,未经财团法人工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610160825.5/2.html,转载请声明来源钻瓜专利网。