[发明专利]对移动终端的图片文字朗读的方法、装置和移动终端在审
申请号: | 201310282530.5 | 申请日: | 2013-07-05 |
公开(公告)号: | CN103365988A | 公开(公告)日: | 2013-10-23 |
发明(设计)人: | 秦银;朱振宇 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L13/027;H04L29/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 移动 终端 图片 文字 朗读 方法 装置 | ||
技术领域
本发明涉及移动终端技术领域,特别涉及一种对移动终端的图片文字朗读的方法、图片文字朗读的装置,及一种具有该图片文字朗读的装置的移动终端。
背景技术
现有TTS(Text to Speech,文本转语音)技术只能将文本直接转化成语音。移动终端如果需要朗读功能,一般是由单个应用程序直接集成TTS模块,在获取程序自身的文本数据之后,TTS模块将其转化成语音朗读出来的。获取的文本数据往往是程序私有的数据,存在于移动终端的数据库或者磁盘上,而且各自编码方式不尽相同,对于其他应用或者系统是不可见的。例如手机浏览器或者一些新闻类的应用程序中的文字显示在屏幕上,其他的应用程序或者系统获取不到,此类文字是以图片的形式显示在屏幕上的。因此,移动终端的单个应用能够通过TTS(Text to Speech)技术,将其内部的文本数据转化为语音播放出来,但是,单纯地采用TTS技术无法在移动终端设备上为所有的应用程序提供朗读的服务,使用场景有限,且不能作为一种系统的通用朗读服务存在。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的一个目的在于提出一种对移动终端的图片文字朗读的方法,根据本发明提出的对移动终端的图片文字朗读的方法,可以为移动终端上的应用程序提供一种通用的朗读服务,更加方便。
本发明的另一个目的在于提出一种对移动终端的图片文字朗读的装置。
本发明的再一个目的在于提出一种移动终端,该装置包括上述对移动终端的图片文字朗读的装置。
为达到上述目的,本发明第一方面实施例提出一种对移动终端的图片文字朗读的方法,包括以下步骤:设置取图工具,其中,所述取图工具的窗口层级高于所述移动终端的应用程序的层级;当检测到用户的触发指令时,所述取图工具根据所述用户的手势截取屏幕上的图片信息;对所述图片信息进行图像转文字识别操作以得到多个文字;以及对所述多个文字进行文字转音频识别操作以得到相应的音频信息,并将所述音频信息进行播放。
根据本发明实施例的对移动终端的图片文字朗读的方法,通过将图片文字转成文字信息,进而将文字信息转成音频信息进行播放,可以为移动终端的应用程序提供一种通用的朗读服务,更加方便,提升了用户体验。
在本发明的一个实施例中,所述设置取图工具包括如下步骤:
开启一个后台服务,所述后台服务向窗口管理器申请窗口,并设置窗口层级高于所述移动终端的应用程序的层级,则所述窗口内设置视图以得到所述取词工具。
在本发明的一些实施例中,对所述图片信息进行图像转文字识别操作,包括如下步骤:
根据所述移动终端内的图像转文字识别库对所述图片信息进行图像转文字识别操作。
在本发明的另一个实施例中,对所述图片信息进行图像转文字识别操作,包括如下步骤:
将所述图片信息上传至图像转文字服务器,所述图像转文字服务器根据内部的图像转文字识别库所述图片信息进行图像转文字识别操作,并将识别结果发送至所述移动终端。
在本发明的一个实施例中,对所述多个文字进行文字转音频识别操作,包括以下步骤:
根据所述移动终端内的文字转音频识别库对所述多个文字进行图像转文字识别操作。
在本发明的一些实施例中,对所述多个文字进行文字转音频识别操作,包括以下步骤:
将所述多个文字上传至文字转音频服务器,所述文字转音频服务器根据内部的文字转音频识别库所述词组信息进行文字转音频识别操作,并将识别结果发送至所述移动终端。
为达到上述目的,本发明的第二方面实施例提出一种对移动终端的图片文字朗读的装置,包括:取图工具,当检测到用户的触发指令时,所述取图工具根据所述用户的手势截取屏幕上的图片信息,其中,所述取图工具的窗口层级高于所述移动终端的应用程序的层级;图像转文字模块,所述图像转文字模块用于对所述图片信息进行图像转文字识别操作以得到多个文字;文字转音频模块,所述文字转音频模块用于对所述多个文字进行文字转音频识别操作以得到相应的音频信息;以及播放模块,所述播放模块用于将所述音频信息进行播放。
根据本发明实施例的对移动终端的图片文字朗读的装置,通过取图工具获取图片,并通过图片转文字模块将图片转成文字,进而通过文字转音频模块将文字转成音频进行播放,可以为移动终端上的应用程序提供一种通用的朗读服务,更加方便,提升了用户体验。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310282530.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种相似字符串检索方法
- 下一篇:基于幻灯片播放的内容动态调整方法