[发明专利]一种精准框题的方法、装置、系统、电子设备及存储介质有效
申请号: | 202010398552.8 | 申请日: | 2020-05-12 |
公开(公告)号: | CN111582264B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 赵华 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/19 |
代理公司: | 广州智斧知识产权代理事务所(普通合伙) 44649 | 代理人: | 孔德超 |
地址: | 528850 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 精准 方法 装置 系统 电子设备 存储 介质 | ||
本发明实施例公开了一种精准框题的方法、装置、系统、电子设备及存储介质。该方法包括:存储扫描页面,构建扫描页面集合;接收初始图像以及初始图像中的目标点坐标;基于初始图像中的页码确定扫描页面集合中的目标扫描页面;通过第一坐标变换,获取目标点坐标在目标扫描页面对应的关联坐标;根据目标扫描页面中预先绘制的一个或多个勾勒区域坐标以及关联坐标的位置关系确定目标勾勒区域坐标;通过第二坐标变换,获取目标勾勒区域坐标在初始图像中对应的精框区域坐标;选取初始图像中精框区域坐标内的图片内容作为框选内容。实施本发明实施例,可以根据目标点坐标和勾勒区域坐标的位置比对确定精框区域坐标,框选内容准确率高。
技术领域
本发明涉及图像处理技术领域,具体涉及一种精准框题的方法、装置、系统、电子设备及存储介质。
背景技术
为了解决中小学的作业难题,目前,市场上出现了很多解决学生作业难题的搜题或错题汇总类应用程序,这些应用程序都是通过摄像头拍摄题目图片以作为错题保存或用来搜索对应的答案。其实现方法大致分为三种:
第一种是通过手动拖到裁剪框的方式框选自己想要的题目,这种方式想要多次操作裁剪框,以使裁剪框变大或变小,才能精确获取题目图片,该方式操作不方便,比较繁琐。
第二种是基于承载体上使用操作体选取一个点,然后根据这个点进行拍照并基于预设规则以一定的训练模型得到题目图片,其较第一种方式更加智能,但是由于识别现象通常集中在一个点的范围内,可能会造成获取的内容图片不完整或者存在无效信息,搜题的结果容易出错。
第三种方式是基于轨迹的方式,例如使用操作体在承载体上移动,使得移动轨迹形成闭合曲线框,摄像头识别移动轨迹,智能终端基于移动轨迹将闭合曲线框内的内容框选出,或者使得承载体上以待框选内容的起点坐标和终点坐标作为移动轨迹的两端,然后基于该起点坐标和终点坐标作为对角线构建矩形框,得到矩形框内的内容。
无论哪种方式,每次均需要针对一道题目进行拍照、裁剪、涂抹等操作,而且裁剪过程中,需要用户手动参与获取选择框,过程繁琐效率很低。
发明内容
针对所述缺陷,本发明实施例公开了一种精准框题的方法、装置、系统、电子设备及存储介质,其通过预先标注的勾勒区域与目标点坐标进行匹配确定精框区域,框题准确率高。
本发明实施例第一方面公开一种精准框题的方法,所述方法包括:
存储扫描页面,构建扫描页面集合;
接收初始图像以及初始图像中的目标点坐标;
基于所述初始图像中的页码确定扫描页面集合中的目标扫描页面;
通过第一坐标变换,获取所述目标点坐标在目标扫描页面对应的关联坐标;
根据目标扫描页面中预先绘制的一个或多个勾勒区域坐标以及所述关联坐标的位置关系确定目标勾勒区域坐标;
通过第二坐标变换,获取所述目标勾勒区域坐标在所述初始图像中对应的精框区域坐标;
选取所述初始图像中精框区域坐标内的图片内容作为框选内容。
作为一种可选的实施方式,在本发明实施例第一方面中,所述存储扫描页面,构建扫描页面集合,包括:
扫描承载体的各个页面,得到多个扫描版面;
在先对所述承载体的各个页面基于题目信息绘制勾勒区域,或者对各个扫描版面基于题目信息绘制勾勒区域;
提取每个扫描版面中的各个勾勒区域坐标和预设区域图像,形成扫描版面对应的扫描页面;
将所述扫描页面汇总形成扫描页面集合,存储所述扫描页面集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010398552.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种螺旋转子发动机
- 下一篇:一种导向溢流阀用整体插装式阀芯组件