[发明专利]文本区域检测方法、装置、存储介质以及计算机设备在审
申请号: | 202110589174.6 | 申请日: | 2021-05-27 |
公开(公告)号: | CN115410202A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 赵佳鹏 | 申请(专利权)人: | 广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V20/62;G06V30/164;G06V30/19;G06N3/08 |
代理公司: | 北京恒博知识产权代理有限公司 11528 | 代理人: | 张晓芳 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 区域 检测 方法 装置 存储 介质 以及 计算机 设备 | ||
1.一种文本区域检测方法,其特征在于,所述方法包括:
获取包含文本的待检测图像,并基于训练得到的特征提取参数获取所述待检测图像的图像特征,所述文本所在区域为曲线区域;
基于训练得到的卷积层参数对所述图像特征进行卷积运算,确定所述文本所在区域的文本中心线;
在所述文本中心线上均匀设置预设数量的样本点,基于所述文本中心线以及各所述样本点,确定至少一个文本框;
将各所述文本框组合,得到所述待检测图像的文本区域。
2.根据权利要求1所述的方法,其特征在于,所述基于所述文本中心线以及各所述样本点,确定至少一个文本框,包括:
以各所述样本点为切点,获取各所述样本点在所述文本中心线上的切线;
获取各所述切线对应的法线;
确定相邻的两条所述法线之间的区域内的文本框。
3.根据权利要求2所述的方法,其特征在于,所述确定相邻的两条所述法线之间的区域内的文本框,包括:
确定任意两条相邻的所述法线之间的区域;
基于训练得到的边界参数与各所述区域内的子文本中心线获取各所述区域的四个边界顶点;
将各所述区域内的各所述边界顶点依次连接,得到文本框。
4.根据权利要求1所述的方法,其特征在于,所述基于训练得到的特征提取参数获取所述待检测图像的图像特征,包括:
基于训练得到的特征提取参数获取所述待检测图像的第一图像特征;
对所述待检测图像进行下采样,得到下采样图像,并基于训练得到的特征提取参数获取所述下采样图像的第二图像特征;
所述基于训练得到的卷积层参数对所述图像特征进行卷积运算,确定所述文本所在区域的文本中心线,包括:
基于训练得到的卷积层参数对所述第一图像特征以及所述第二图像特征进行卷积运算,确定所述文本所在区域的文本中心线。
5.根据权利要求1所述的方法,其特征在于,所述获取待检测图像,并基于预先得到的特征提取参数获取所述待检测图像的图像特征之前,还包括:
获取训练数据,所述训练数据包括训练图像、所述训练图像中的实际文本区域以及实际文本中心线;
基于训练前的初始特征提取参数获取所述训练图像的训练图像特征;
基于训练前的初始卷积层参数对所述训练图像特征进行卷积运算,确定所述训练图像中的训练文本的训练文本中心线;
在所述训练文本中心线上均匀设置所述预设数量的训练样本点;
基于训练前的初始边界参数、所述训练样本点、所述训练文本中心线以及所述实际文本区域的边界线,生成训练文本区域;
基于所述训练文本区域、所述实际文本区域、所述训练文本中心线以及所述实际文本中心线,计算损失值;
基于所述损失值训练初始特征提取参数、初始卷积层参数以及初始边界参数,得到训练完成的特征提取参数、卷积层参数以及边界参数。
6.根据权利要求5所述的方法,其特征在于,所述基于训练前的初始边界参数、所述训练样本点、所述训练文本中心线以及所述实际文本区域的边界线,生成训练文本区域,包括:
基于所述训练样本点、所述训练文本中心线以及所述实际文本区域的边界线,获取第一边界顶点;
基于训练前的初始边界参数、所述训练样本点以及所述训练文本中心线,获取第二边界顶点;
基于所述第一边界顶点对所述第二边界顶点进行优化,得到优化后的边界顶点;
将各所述边界顶点依次连接,得到训练文本框;
将各所述训练文本框组合,得到训练文本区域。
7.根据权利要求6所述的方法,其特征在于,所述基于所述训练样本点、所述训练文本中心线以及所述实际文本区域的边界线,获取第一边界顶点,包括:
以各所述训练样本点为切点,获取各所述训练样本点在所述训练文本中心线上的切线;
获取各所述切线对应的法线,并获取所述实际文本区域的上边界线以及下边界线;
获取各所述法线与所述上边界线、所述下边界线之间的交点,将各所述交点作为第一边界顶点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司,未经广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110589174.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:空调器控制方法、装置、空调器及存储介质
- 下一篇:模拟数字转换器及其操作方法