[发明专利]一种基于视觉识别的阅读方法及装置在审
申请号: | 201910023276.4 | 申请日: | 2019-01-10 |
公开(公告)号: | CN109800748A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 曹建明 | 申请(专利权)人: | 深圳市格莱科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 冯筠 |
地址: | 518000 广东省深圳市光明*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 匹配 书籍内容 特征点 图像 视觉识别 中间圈 存储 集合 播放多媒体文件 几何矫正 时间成本 书籍阅读 图像识别 位置矫正 语音内容 重新排列 自动识别 坐标文件 播放 阅读 调取 语音 书籍 | ||
本发明公开了一种基于视觉识别的阅读方法及装置。其中,所述方法包括:获取书籍内容的图像,进而根据该获取的书籍内容的图像,匹配该图像中间圈特征点,进而根据该匹配得到的该图像中间圈特征点,集合该匹配得到的特征点,存储该集合的该匹配得到的特征点,进而对该存储的特征点进行图像识别匹配包括位置矫正、几何矫正、坐标重新排列等,识别匹配出书籍内容,进而根据该识别匹配出的书籍内容,播放对应该识别匹配出的书籍内容的语音包括从坐标文件库中调取坐标进行对比、点读判断和播放多媒体文件等。通过上述方式,能够实现自动识别书籍内容和播放书籍的语音内容,使得书籍阅读的时间成本得到有效降低。
技术领域
本发明涉及书籍阅读技术领域,尤其涉及一种基于视觉识别的阅读方法及装置。
背景技术
现有的书籍阅读方案,一般是指读或认读,但是在遇上不认识的书籍内容中的字体时,往往需要借助于字典等查阅工具来查阅该不认识的字体的读音,这样导致书籍阅读的时间成本较高。
但是,发明人发现现有技术中至少存在如下问题:
现有的书籍阅读方案,一般是指读或认读,无法实现自动识别书籍内容和播放书籍的语音内容,导致书籍阅读的时间成本较高。
发明内容
有鉴于此,本发明的目的在于提出一种基于视觉识别的阅读方法及装置,能够实现自动识别书籍内容和播放书籍的语音内容,使得书籍阅读的时间成本得到有效降低。
根据本发明的一个方面,提供一种基于视觉识别的阅读方法,包括:
获取书籍内容的图像;
根据所述获取的书籍内容的图像,匹配所述图像中间圈特征点;
根据所述匹配得到的所述图像中间圈特征点,集合所述匹配得到的特征点,存储所述集合的所述匹配得到的特征点;
对所述存储的特征点进行图像识别匹配包括位置矫正、几何矫正、坐标重新排列等,识别匹配出书籍内容;
根据所述识别匹配出的书籍内容,播放对应所述识别匹配出的书籍内容的语音包括从坐标文件库中调取坐标进行对比、点读判断和播放多媒体文件等。
其中,所述根据所述获取的书籍内容的图像,对所述获取的书籍内容的图像的图像特征点进行检测,检测得到图像特征点描述符,根据所述检测得到的图像特征点描述符,匹配所述图像中间圈特征点,包括:
根据所述获取的书籍内容的图像,采用稳定特征加速算法,对所述获取的书籍内容的图像的图像特征点进行检测,检测得到图像特征点描述符,根据所述检测得到的图像特征点描述符,匹配所述图像中间圈特征点。
其中,所述根据所述匹配得到的所述图像中间圈特征点,集合所述匹配得到的特征点,存储所述集合的所述匹配得到的特征点,包括:
根据所述匹配得到的所述图像中间圈特征点,集合所述匹配得到的特征点,采用分割k维数据空间的数据结构方式,存储所述集合的所述匹配得到的特征点。
其中,所述对所述存储的特征点进行图像识别匹配包括位置矫正、几何矫正、坐标重新排列等,识别匹配出书籍内容,包括:
采用K-邻近算法方式,对所述存储的特征点进行图像识别匹配包括位置矫正、几何矫正、坐标重新排列等,识别匹配出书籍内容。
其中,所述根据所述识别匹配出的书籍内容,播放对应所述识别匹配出的书籍内容的语音包括从坐标文件库中调取坐标进行对比、点读判断和播放多媒体文件等,包括:
根据所述识别匹配出的书籍内容,采用随机抽样一致算法方式,为所述识别匹配出的书籍内容配置语音,并播放所述配置的书籍内容的语音,播放对应所述识别匹配出的书籍内容的语音包括从坐标文件库中调取坐标进行对比、点读判断和播放多媒体文件等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市格莱科技有限公司,未经深圳市格莱科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910023276.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:医疗发票识别方法、用户设备、存储介质及装置
- 下一篇:一种文字识别方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序