[发明专利]一种基于文字图像识别音频阅读方法及其装置在审
申请号: | 201810747552.7 | 申请日: | 2018-07-09 |
公开(公告)号: | CN109034148A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 岳子煊;李雨晴;霍文奇 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | G06K9/22 | 分类号: | G06K9/22;G06K9/34;G06F17/30;G09B5/06;G09B17/00 |
代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 吕学文;武媛 |
地址: | 221116 江苏省徐州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字图像信息 文字材料 文字信息 匹配 文字图像识别 辅助阅读 音频信息 阅读 图像识别技术 预处理 采集 扬声器播放 音频数据库 匹配技术 实时播放 文字符号 自动变焦 点读笔 应用 | ||
1.一种基于文字图像识别音频阅读方法,其特征在于,所述方法包括:
采集文字材料上的文字图像信息,通过自动变焦使得每一文字图像信息对应至少一文字符号的图形;
对所述文字图像信息进行预处理,识别所述文字图像信息并进行文字信息匹配;
将匹配的所述文字信息与音频数据库的文字音频信息进行匹配,并将所述文字音频信息进行实时播放。
2.根据权利要求1所述的一种基于文字图像识别音频阅读方法,其特征在于,所述对所述文字图像信息进行预处理包括:
对所述文字图像信息进行灰度处理,并利用自适应阈值对所述文字图像信息进行阈值处理,增加对比度。
3.根据权利要求1所述的一种基于文字图像识别音频阅读方法,其特征在于,所述采集文字材料上的文字图像信息,通过自动变焦使得每一文字图像信息对应至少一文字符号的图形包括:
当摄像头靠近并正对所述文字材料时,根据所述文字材料的字体大小,通过自动变焦使得每一图片内仅有一文字符号的图形。
4.根据权利要求1所述的一种基于文字图像识别音频阅读方法,其特征在于,当所述文字图像信息识别失败或者所述文字音频信息匹配失败时,发出报警提示。
5.根据权利要求1所述的一种基于文字图像识别音频阅读方法,其特征在于,利用云端数据库更新所述音频数据库以及对应的文字图像数据库。
6.根据权利要求1所述的一种基于文字图像识别音频阅读方法,其特征在于,利用一显示屏实时显示所识别的文字信息,并显示云端数据库发送的所述文字信息对应的文字解释。
7.一种基于文字图像识别音频阅读装置,其特征在于,所述装置包括:装置本体,设置在装置本体上端的扬声器、设置在装置本体末端的自动变焦摄像头以及设置在所述装置本体内的主控电路板和锂电池;所述主控电路板上集成设置有微处理器,以及与所述微处理器电性连接的图形识别芯片、混音处理芯片、音频存储器和图片存储器,所述自动变焦摄像头采集文字材料的文字图像信息,通过所述图形识别芯片和所述图片存储器匹配识别所述文字图像信息,所述微处理器将所识别的文字信息与所述音频存储器的音频数据库进行匹配,通过所述混音处理芯片后发送到所述扬声器。
8.根据权利要求7所述的一种基于文字图像识别音频阅读装置,其特征在于,所述主控电路板上还设置有电源管理芯片,所述电源管理芯片与所述微处理器连接,对应所述电源管理芯片设置有充电接口。
9.根据权利要求7所述的一种基于文字图像识别音频阅读装置,其特征在于,所述装置本体上还设置有显示屏和辅助摄像头,所述显示屏和所述辅助摄像头与所述微处理器连接。
10.根据权利要求7所述的一种基于文字图像识别音频阅读装置,其特征在于,所述装置本体两侧分别设置有USB数据接口、音频按键、切换按键以及耳机插孔。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810747552.7/1.html,转载请声明来源钻瓜专利网。