[发明专利]一种图片识别语音翻译方法及其翻译设备无效
申请号: | 201310205463.7 | 申请日: | 2013-05-27 |
公开(公告)号: | CN103268316A | 公开(公告)日: | 2013-08-28 |
发明(设计)人: | 于洋 | 申请(专利权)人: | 江苏圆坤科技发展有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06K9/00;G10L15/00 |
代理公司: | 北京中海智圣知识产权代理有限公司 11282 | 代理人: | 曾永珠 |
地址: | 212009 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 识别 语音 翻译 方法 及其 设备 | ||
技术领域
本发明涉及图片识别和语音翻译技术,更具体涉及一种图片识别语音翻译方法及其翻译设备,用于翻译领域。
背景技术
语音自动翻译是将一种语音经过语言识别进而翻译为另一种语音。最为常见的语音自动翻译是将外国标准语音翻译为汉语标准语音。
语音自动翻译另一个发展方向是将方言语音翻译为标准语音。为将汉语方言语音自动翻译为汉语普通话语音,开发方言翻译引擎的工作逐渐展开。方言识别的难度、语速差异,普通话的标准度直接影响着翻译结果的准确性。就语速差异而言,目前的语音识别系统采用单一传感器,即声音传感器进行语音识别,不可能对捕获的语音信息进行细分,只能采用定速率跟踪识别,将语音信息与系统库中的模板进行匹配判断。如果捕获信息的速率与存储在系统库中的模板相差不多,则能正常工作,否则将会出现误判。然而现实生活中,人们说话不可能总保持相同的速率,而是不断变化的,这势必造成了语音识别系统的误差增多,以致降低语音识别系统的实用性。
语音自动翻译针对单词、词组的翻译效果较好,但是针对较长句子,不能准确识别,进行准确翻译。
对于不会读的单词或者词句,语音自动翻译无法进行翻译。
图片翻译是将图片经过图像识别进而提取图片中信息,翻译的结果大多为文字信息。已有图片翻译对摄像头获取的图片信息进行翻译,手机显示译文。图片翻译都对图片像素要求极高。一般用户的手机像素不能达到图片翻译要求的标准,因此,所述手机的摄像不能通过识别进行翻译,图片翻译不能大范围推广使用。目前,图片翻译比较适合短文字、标牌标语之类的图片。除此之外,对于其他图片语句,图片翻译不能直接准确地翻译。比较好的解决方案是先扫描识别,然后再利用翻译工具翻译或者人工翻译。这种方案没有真正地实现了图片翻译。
发明内容
本发明克服上述语音自动翻译技术缺陷,结合图片翻译,提出一种图片识别语音翻译方法及其翻译设备。
图片识别语音翻译系统不存在语言的速率问题,也不存在方言的问题,不受语言的限制,只要提供符合格式的图片(如gif、jpeg、png),就会根据图片上的文字来进行目标语言的翻译。本发明主要解决的技术问题是识别图片上的语言输出语音,本发明主要解决的技术问题还包括增强图片识别率,提高翻译准确率。所述系统对图片像素要求较低,避免了因像素低而造成识别失败,大大的提高了翻译效率与准确性。
本发明图片识别语音翻译方法及其翻译设备如下:
一种图片识别语音翻译方法如下:
(1)图像采集模块对图片对象进行图像采集,将图像采集结果导入图像识别器;
(2)利用自身的词汇库及语言库,所述图像识别器对所述图像采集结果进行图像识别,将识别结果导入语言分析器;
(3)利用语义规则库,所述语言分析器对所述识别结果进行语言分析,将分析结果导入翻译处理器;
(4)所述翻译处理器对所述分析结果进行翻译处理,得到翻译结果;所述翻译处理器对所述翻译结果进行词法、语法、语义检查;若所述翻译结果没有通过检查,所述翻译处理器将所述翻译结果导入图像识别器;若所述翻译结果通过检查,所述翻译结果存储在存储设备,和/或输入互联网;所述翻译处理器将所述翻译结果导入语音识别转换器;
(5)所述语音识别转换器对所述翻译结果进行语音转换,并语音输出。
优选地,对于超过阈值的图像采集结果,所述步骤(1)还包括图像采集模块将所述图像采集结果导入图像数字化模块进行图像数字化,所述图像数字化模块将所述图像数字化结果导入图像分割器,所述图像分割器将所述图像数字化结果进行语句及段落的分割,把分割结果进行对比分析,将对比分析结果导入图像识别器;所述步骤(2)还包括所述图像识别器利用所述对比分析结果对所述图像采集结果进行图像识别。
所述阈值需要根据图像识别器的处理能力提前设定,与图像采集结果所包含段落大小与数目相关。
一种图片识别语音翻译设备,包括:图像采集模块、图像数字化模块、图像分割器、包含词汇库及语言库的图像识别器、语言分析器、语义规则库、翻译处理器、存储设备、互联网接口、语音识别转换器;
所述图像采集模块将图像采集结果导入图像识别器,将超过阈值的图像采集结果导入图像数字化模块;
所述图像数字化模块对所述图像采集结果进行图像数字化,所述图像数字化模块将所述图像数字化结果导入图像分割器;
所述图像分割器将超过阈值的图像采集结果进行语句及段落的分割,把分割结果进行对比分析,将对比分析结果导入图像识别器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏圆坤科技发展有限公司,未经江苏圆坤科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310205463.7/2.html,转载请声明来源钻瓜专利网。