[发明专利]辅助阅读方法、装置、电子设备和存储介质有效
申请号: | 202010301997.X | 申请日: | 2020-04-16 |
公开(公告)号: | CN111539405B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 贾光辉;王晓斐 | 申请(专利权)人: | 安徽淘云科技股份有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/146;G06V30/18;G06V30/19 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 230031 安徽省合肥市中国(安徽)自由贸易试验区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 辅助 阅读 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供一种辅助阅读方法、装置、电子设备和存储介质,其中方法包括:确定用户手指在待读页面图像上的页面指读位置;基于页面指读位置,以及待读页面图像及其对应的参照页面图像之间的坐标映射关系,确定页面指读位置映射在参照页面图像中的粗略指读位置;基于页面指读位置在待读页面图像中的页面感兴趣区域,以及粗略指读位置在参照页面图像中的参照感兴趣区域,确定参照页面图像中的精细指读位置;基于精细指读位置,进行辅助阅读。本发明实施例提供的辅助阅读方法、装置、电子设备和存储介质,提高了待读区域确定的便捷性和准确性。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种辅助阅读方法、装置、电子设备和存储介质。
背景技术
近年来,由于人们逐渐重视阅读水平的提升,各类辅助阅读方法不断涌现,逐渐替代了成本高、书本覆盖面窄的早期辅助阅读产品“点读笔”。
目前的辅助阅读方法中,需要用户预先设置好将要阅读的内容,或者在用户使用手指指示出将要阅读的区域之后,基于OCR(Optical Character Recognition,光学字符识别)方法识别出用户将要阅读的内容。然而,若是预先设置将要阅读的内容,一旦用户想要更换阅读区域,则需要重新进行设置,操作复杂;若是基于OCR方法识别将要阅读的内容,则会因为手指的遮挡导致无法准确识别出指示区域的内容。
发明内容
本发明实施例提供一种辅助阅读方法、装置、电子设备和存储介质,用以解决现有辅助阅读方法确定用户将要阅读内容的操作复杂、不准确的问题。
第一方面,本发明实施例提供一种辅助阅读方法,包括:
确定用户手指在待读页面图像上的页面指读位置;
基于所述页面指读位置,以及所述待读页面图像及其对应的参照页面图像之间的坐标映射关系,确定所述页面指读位置映射在所述参照页面图像中的粗略指读位置;
基于所述页面指读位置在所述待读页面图像中的页面感兴趣区域,以及所述粗略指读位置在所述参照页面图像中的参照感兴趣区域,确定所述参照页面图像中的精细指读位置;
基于所述精细指读位置,进行辅助阅读。
可选地,所述基于所述页面指读位置在所述待读页面图像中的页面感兴趣区域,以及所述粗略指读位置在所述参照页面图像中的参照感兴趣区域,确定所述参照页面图像中的精细指读位置,具体包括:
将所述页面感兴趣区域的每一特征点和所述参照感兴趣区域的每一特征点进行匹配,得到页面区域特征点集合以及与其相匹配的参照区域特征点集合;
基于所述页面区域特征点集合以及所述参照区域特征点集合,确定所述精细指读位置。
可选地,所述基于所述页面区域特征点集合以及所述参照区域特征点集合,确定所述精细指读位置,具体包括:
基于所述页面区域特征点集合,确定所述页面指读位置对应的每一页面邻域点;
基于每一页面邻域点以及所述参照区域特征点集合,确定所述粗略指读位置对应的每一参照邻域点;
基于每一页面邻域点以及每一参照邻域点,确定所述精细指读位置。
可选地,所述基于所述页面区域特征点集合,确定所述页面指读位置对应的每一页面邻域点,具体包括:
逐次增大所述页面指读位置对应邻域的范围,直至所述邻域内包含的属于所述页面区域特征点集合中的特征点的数量大于预设阈值;
将所述邻域内包含的属于所述页面区域特征点集合中的特征点,作为所述页面指读位置对应的页面邻域点。
可选地,所述基于每一页面邻域点以及每一参照邻域点,确定所述精细指读位置,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽淘云科技股份有限公司,未经安徽淘云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010301997.X/2.html,转载请声明来源钻瓜专利网。