[发明专利]一种书本页面的识别方法、装置、电子设备和存储介质在审
申请号: | 202010321083.X | 申请日: | 2020-04-22 |
公开(公告)号: | CN111524148A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 杨宗武 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/12 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 书本 页面 识别 方法 装置 电子设备 存储 介质 | ||
本发明属于计算机技术领域,公开了一种书本页面的识别方法、装置、电子设备和存储介质,其方法包括:通过对待检测图片进行实例分割处理,识别所述待检测图片中的至少一个书本页面;对每个所述书本页面进行坐标回归处理;将每个所述书本页面的回归坐标值映射回所述待检测图片,得到每个所述书本页面在所述待检测图片中的位置。通过本方案可以实现准确、高效、高精度识别与检测至少一个书本页面。
技术领域
本发明涉及计算机技术领域,尤指一种书本页面的识别方法、装置、电子设备和存储介质。
背景技术
当前市场上的书本页面检测产品一般是通过传统图像算法获取轮廓得出书本边,然后计算书本页面的角点得出书本页区域,但是存在抗干扰性差的问题。或者通过回归算法回归书本页面的角点来实现书本边的检测,如果书本页面四个书本角被遮挡或某些书本角超出区域外,那么书本页面的角点坐标会回归到错误的位置上,存在检测不准确的问题。而且现有技术中的书本页面检测产品仅仅针对一个书本页面的检测,无法实现同时检测多个书本页面。
发明内容
本发明的目的是提供一种书本页面的识别方法、装置、电子设备和存储介质,能够准确、高效、高精度的实现对至少一个书本页面的检测。
本发明提供的技术方案如下:
一方面,提供一种书本页面的识别方法,包括步骤:
通过对待检测图片进行实例分割处理,识别所述待检测图片中的至少一个书本页面。
对每个所述书本页面进行坐标回归处理。
将每个所述书本页面的回归坐标值映射回所述待检测图片,得到每个所述书本页面在所述待检测图片中的位置。
本方案基于图像实例分割思想,首先将各个书本页面分割开来,能够支持一个和多个书本页面检测与识别,提高了书本页面检测的准确性,同时对多个书本页面进行检测,提高了书本页面检测的效率。
进一步优选地,所述通过对待检测图片进行实例分割处理,识别所述待检测图片中的至少一个书本页面,包括步骤:
通过目标检测方法框出所述待检测图片的不同实例,识别所述待检测图片是否存在至少一个所述书本页面。
当存在至少一个所述书本页面时,获取每个所述书本页面的矩形区域坐标以及对应的掩码图。
进一步优选地,所述对每个所述书本页面进行坐标回归处理,包括步骤:
根据所述矩形区域坐标将所述掩码图分别裁剪成至少一个掩码子图;对每个所述掩码子图分别做对应书本页面的角点坐标回归处理,得到所述掩码子图对应书本页面的角点横坐标和角点纵坐标。
进一步优选地,所述将每个所述书本页面的回归坐标值映射回所述待检测图片,得到每个所述书本页面在所述待检测图片中的位置,包括步骤:
根据所述矩形区域坐标,将所述掩码子图对应书本页面的角点横坐标和角点纵坐标映射回所述待检测图片,得到每个所述书本页面在所述待检测图片中的坐标数组。
根据每个所述书本页面在所述待检测图片中的坐标数组,获得每个所述书本页面在所述待检测图片中的位置。
本方案中,通过图像实例分割算法将图片全局回归改为局部子图回归,同时根据掩码图方式回归,去除了大部分非书本区域干扰,提升了识别书本四个角的精度。本方案中,对于只存在一个书本页面和多个书本页面的情况都可以进行精确的检测。
进一步优选地,在所述通过目标检测方法框出所述待检测图片的不同实例,识别所述待检测图片是否存在至少一个所述书本页面之后还包括步骤:当不存在所述书本页面时,退出对所述待检测图片的识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010321083.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于金字塔注意力网络的人群计数方法及系统
- 下一篇:天线装置