[发明专利]一种基于文字图像识别音频阅读方法及其装置在审

申请号：	201810747552.7	申请日：	2018-07-09
公开（公告）号：	CN109034148A	公开（公告）日：	2018-12-18
发明（设计）人：	岳子煊;李雨晴;霍文奇	申请（专利权）人：	中国矿业大学
主分类号：	G06K9/22	分类号：	G06K9/22;G06K9/34;G06F17/30;G09B5/06;G09B17/00
代理公司：	北京知呱呱知识产权代理有限公司 11577	代理人：	吕学文;武媛
地址：	221116 江苏省徐州***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文字图像信息文字材料文字信息匹配文字图像识别辅助阅读音频信息阅读图像识别技术预处理采集扬声器播放音频数据库匹配技术实时播放文字符号自动变焦点读笔应用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于文字图像识别音频阅读方法，其特征在于，所述方法包括：

采集文字材料上的文字图像信息，通过自动变焦使得每一文字图像信息对应至少一文字符号的图形；

对所述文字图像信息进行预处理，识别所述文字图像信息并进行文字信息匹配；

将匹配的所述文字信息与音频数据库的文字音频信息进行匹配，并将所述文字音频信息进行实时播放。

2.根据权利要求1所述的一种基于文字图像识别音频阅读方法，其特征在于，所述对所述文字图像信息进行预处理包括：

对所述文字图像信息进行灰度处理，并利用自适应阈值对所述文字图像信息进行阈值处理，增加对比度。

3.根据权利要求1所述的一种基于文字图像识别音频阅读方法，其特征在于，所述采集文字材料上的文字图像信息，通过自动变焦使得每一文字图像信息对应至少一文字符号的图形包括：

当摄像头靠近并正对所述文字材料时，根据所述文字材料的字体大小，通过自动变焦使得每一图片内仅有一文字符号的图形。

4.根据权利要求1所述的一种基于文字图像识别音频阅读方法，其特征在于，当所述文字图像信息识别失败或者所述文字音频信息匹配失败时，发出报警提示。

5.根据权利要求1所述的一种基于文字图像识别音频阅读方法，其特征在于，利用云端数据库更新所述音频数据库以及对应的文字图像数据库。

6.根据权利要求1所述的一种基于文字图像识别音频阅读方法，其特征在于，利用一显示屏实时显示所识别的文字信息，并显示云端数据库发送的所述文字信息对应的文字解释。

7.一种基于文字图像识别音频阅读装置，其特征在于，所述装置包括：装置本体，设置在装置本体上端的扬声器、设置在装置本体末端的自动变焦摄像头以及设置在所述装置本体内的主控电路板和锂电池；所述主控电路板上集成设置有微处理器，以及与所述微处理器电性连接的图形识别芯片、混音处理芯片、音频存储器和图片存储器，所述自动变焦摄像头采集文字材料的文字图像信息，通过所述图形识别芯片和所述图片存储器匹配识别所述文字图像信息，所述微处理器将所识别的文字信息与所述音频存储器的音频数据库进行匹配，通过所述混音处理芯片后发送到所述扬声器。

8.根据权利要求7所述的一种基于文字图像识别音频阅读装置，其特征在于，所述主控电路板上还设置有电源管理芯片，所述电源管理芯片与所述微处理器连接，对应所述电源管理芯片设置有充电接口。

9.根据权利要求7所述的一种基于文字图像识别音频阅读装置，其特征在于，所述装置本体上还设置有显示屏和辅助摄像头，所述显示屏和所述辅助摄像头与所述微处理器连接。

10.根据权利要求7所述的一种基于文字图像识别音频阅读装置，其特征在于，所述装置本体两侧分别设置有USB数据接口、音频按键、切换按键以及耳机插孔。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国矿业大学，未经中国矿业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810747552.7/1.html，转载请声明来源钻瓜专利网。

上一篇：基于深度学习和自然语言的光学字符识别优化方法和系统
下一篇：一种字符识别方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于文字图像识别音频阅读方法及其装置在审

专利文献下载