[实用新型]一种基于OCR和TTS的低视力阅读助视系统有效
申请号: | 201520484407.6 | 申请日: | 2015-07-07 |
公开(公告)号: | CN204856534U | 公开(公告)日: | 2015-12-09 |
发明(设计)人: | 高铁塔 | 申请(专利权)人: | 北京奥美达科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 孟阿妮;郭栋梁 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ocr tts 视力 阅读 系统 | ||
技术领域
本实用新型涉及电子阅读设备技术领域,尤其涉及一种基于OCR和TTS的低视力阅读助视系统。
背景技术
低视力患者及老年人在阅读书报、文件、说明书等图文时存在不同程度的障碍,传统方式是借助放大镜,但因其仅为光学放大,存在放大倍数有限、边缘变形等问题,因此在欧美等发达国家,基本已淘汰了放大镜,普遍使用电子助视装置等改善低视力人群阅读障碍的高科技产品,但是低视力人群在长时间使用眼睛的状况下会引起视力恶化。
随着终端技术、软件技术的发展,特别是智能终端技术、OCR技术与TTS技术的发展,为OCR技术与TTS技术的结合提供了可行性。
文字识别技术(OpticalCharacterRecognition,简称OCR)即通过光学技术对文字进行识别,是自动识别技术研究和应用领域中的一种重要技术。它能够将文字自动识别录入到电脑中,适用于建立网络图书馆,将纸质书籍扫描,以文件的形式存入电脑然后通过OCR文字识别软件识别需要的文字就可以文本文件的形式显示。
语音合成技术(TextToSpeech,简称TTS),涉及声学、语言学、数字信号处理技术、多媒体技术等多个学科技术,是中文信息处理领域的一项前沿技术。
与一些用预先录制的声音文件实现发声的应用程序相比,TTS的发声引擎只有几兆大小,不需要大量的声音文件支持,因此可以节省很大的储存空间,并且可以朗读预先未知的任何语句。现在已经有许多应用软件应用TTS技术实现语音功能,例如一些播音软件可以用来读小说或作校对工作,还可以朗读电子邮件,一些电子词典可以读出单词,还可以用于查询中心自动播放服务信息等。
实用新型内容
在下文中给出关于本实用新型的简要概述,以便提供关于本实用新型的某些方面的基本理解。应当理解,这个概述并不是关于本实用新型的穷举性概述。它并不是意图确定本实用新型的关键或重要部分,也不是意图限定本实用新型的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
本实用新型提供一种降低眼部使用频率、同时实现阅读的基于OCR和TTS的低视力阅读助视系统。
本实用新型提供一种基于OCR和TTS的低视力阅读助视系统,包括:
图像采集模块,用于扫描阅读对象,采集并输出图像;
处理模块,包括:
OCR文字识别单元,与所述图像采集模块连接,用于接收所述图像,对所述图像进行图像预处理和单字识别,得到所述图像对应的文本文件;
TTS引擎单元,与所述OCR文字识别单元连接,用于将所述文本文件转换为音频文件;
输出模块,与所述处理模块连接,用于同步输出所述文本文件和所述音频文件。
本实用新型提供的基于OCR和TTS的低视力阅读助视系统结合了OCR文字识别技术和TTS语音识别技术,通过图像采集模块对阅读对象进行扫描并采集图像,通过处理模块对采集的图像进行处理并最终通过输出模块同步显示阅读文本和输出对应的音频,从而为用户实现了听读为主、目视辅助的阅读方式。用户还可通过键盘或触摸屏设置显示模式,例如黑底白字、白底黑字、护眼模式等显示模式,进一步缓解眼部疲劳,实现了辅助低视力患者、老视人群及盲人用户进行阅读的作用。综上所述,本实用新型具有使用便捷、缓解眼部疲劳等优点。
附图说明
参照下面结合附图对本实用新型实施例的说明,会更加容易地理解本实用新型的以上和其它目的、特点和优点。附图中的部件只是为了示出本实用新型的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。
图1为本实用新型一种基于OCR和TTS的低视力阅读助视系统的一种实施方式的系统结构示意图。
图2为本实用新型一种基于OCR和TTS的低视力阅读助视系统的一种优选实施方式的系统结构示意图。
图3为本实用新型一种基于OCR和TTS的低视力阅读助视系统的另一种优选实施方式的系统结构示意图。
附图标记说明:
10图像采集模块
20用户输入模块
30处理模块
50输出模块
301OCR文字识别单元
303TTS引擎单元
501显示单元
503音频输出单元
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奥美达科技有限公司,未经北京奥美达科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201520484407.6/2.html,转载请声明来源钻瓜专利网。