[发明专利]文本检测方法、装置、电子设备及计算机存储介质有效
申请号: | 202010942864.0 | 申请日: | 2020-09-09 |
公开(公告)号: | CN111797821B | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 秦勇 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰;兰淑铎 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 装置 电子设备 计算机 存储 介质 | ||
1.一种文本检测方法,其特征在于,所述方法包括:
对待检测文本图像和所述待检测文本图像的梯度图像进行特征提取获得文本特征,根据所述文本特征预测得到所述待检测文本图像的文本区域阈值图、文本区域的中心区域图、中心区域的顶点偏移量特征图,所述偏移量特征图通过预估的偏移量特征生成,用于预估中心区域内的像素点相对于可能的文本区域对应顶点的距离;
获取所述文本区域阈值图对应的文本区域二值图和所述中心区域图对应的中心区域的原始坐标,其中,通过选取属于中心区域的至少一个像素点的坐标表征所述中心区域的原始坐标;
根据所述中心区域的原始坐标和所述偏移量特征图所指示的顶点偏移量,确定文本区域的候选坐标;
根据所述文本区域的候选坐标和所述文本区域二值图,确定至少一个文本区域的对应顶点,根据所述确定的至少一个文本区域的各个顶点,获得所述待检测文本图像的文本检测结果;
其中,对待检测文本图像和所述待检测文本图像的梯度图像进行特征提取获得文本特征,根据所述文本特征预测得到所述待检测文本图像的文本区域阈值图、文本区域的中心区域图、中心区域的顶点偏移量特征图,包括:
将所述待检测文本图像输入第一残差网络,进行第一特征提取,获得第一特征图;将所述待检测文本图像的梯度图像输入第二残差网络,进行第二特征提取,获得第二特征图;将所述第一特征图上采样并串联,通过第一注意力层对上采样并串联后的特征进行注意力计算,获得第一文本特征;将所述第二特征图上采样并串联,通过第二注意力层对上采样并串联后的特征进行注意力计算,获得第二文本特征;将所述第一文本特征和所述第二文本特征进行串联,得到串联后的特征;将所述串联后的特征进行一次卷积操作,两次反卷积操作,获得与所述待检测文本图像和所述待检测文本图像的梯度图像对应的文本特征;根据所述文本特征预测得到待检测图像的文本区域阈值图、文本区域的中心区域图、中心区域的顶点偏移量特征图;其中,中心区域的顶点偏移量特征图包括中心区域内的点相对于文本框顶点的横坐标偏移量和纵坐标偏移量的特征图,所述文本框顶点包括文本框左上顶点、右上顶点、左下顶点和右下顶点。
2.根据权利要求1所述的方法,其特征在于,获取所述中心区域图对应的中心区域的原始坐标,包括:
对所述中心区域图进行二值化,得到中心区域二值图;
对所述中心区域二值图求连通域,得到所述中心区域的原始坐标。
3.根据权利要求1或2所述的方法,其特征在于,根据所述中心区域的原始坐标和所述偏移量特征图所指示的顶点偏移量,确定文本区域的候选坐标,包括:
当所述中心区域的原始坐标包括一个像素点的坐标时,将所述一个像素点的坐标,分别与所述顶点偏移量特征图指示的四个顶点偏移量相加,得到所述文本区域的四个顶点的候选坐标;
或者,
当所述中心区域的原始坐标包括多个像素点的坐标时,将所述多个像素点中的每个像素点的坐标,分别与每个像素点对应的偏移量特征图所指示的四个顶点偏移量相加,得到每个像素点对应的文本区域的四个顶点的候选坐标。
4.根据权利要求3所述的方法,其特征在于,当所述中心区域的原始坐标包括多个像素点的坐标时,所述根据所述文本区域的候选坐标和所述文本区域二值图,获得所述待检测文本图像的文本检测结果,包括:
针对所述四个顶点中的每个顶点,若多个像素点对应的该顶点的候选坐标均位于所述文本区域二值图的边界框中,并且,各个候选坐标之间的距离小于预设距离时,根据该顶点的候选坐标确定所述文本区域的对应顶点;
根据确定的所述文本区域的各个顶点,获得所述待检测文本图像的文本检测结果。
5.根据权利要求1或2所述的方法,其特征在于,根据所述文本特征预测得到所述待检测文本图像的中心区域的顶点偏移量特征图,包括:
根据所述文本特征得到所述待检测文本图像的中心区域的原始顶点偏移量特征;
对所述原始顶点偏移量特征进行取对数操作,根据取对数操作结果获得所述待检测文本图像的中心区域的顶点偏移量特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010942864.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机械制造用焊接设备
- 下一篇:针对文件读写操作的文件路径的获取方法及装置