[发明专利]一种改进的平行四边形候选框的文本检测方法有效
申请号: | 201910857582.8 | 申请日: | 2019-09-09 |
公开(公告)号: | CN110674802B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 李宏亮;陶聚;王强;杨健榜;王晓鹏;罗鹏飞 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/19;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 邹裕蓉 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种改进的平行四边形候选框的文本检测方法,在训练步骤以及检测步骤中,预测特征谱在进入PriorBox层之前先经过偏移学习模块,所述偏移学习模块用于输出预测特征谱以及候选框在Y轴方向的偏移量至PriorBox层;PriorBox层输出的候选框坐标包括矩形候选框坐标与引入偏移的平行四边形候选框;使用平行四边形的候选框来贴近标签GroundTruth,以提升GroundTruth与预测框之间的IoU,从而降低网络回归的困难程度。本发明能准确定位倾斜的长文本,适用于书籍文字识别、然场景下多方向文字识别。 | ||
搜索关键词: | 一种 改进 平行四边形 候选 文本 检测 方法 | ||
【主权项】:
1.一种改进的平行四边形候选框的文本检测方法,其特征在于,包括以下步骤:/n1)训练步骤:/n1-1)得到样本图像的预测特征谱;/n1-2)将预测特征谱分别输入回归特征谱层、分类特征谱层以及前置偏移学习模块的PriorBox层得到回归特征谱、分类特征谱以及候选框坐标;回归特征谱为图像特征谱、分类特征谱为分类置信度;/n所述偏移学习模块用于输出预测特征谱与候选框在Y轴方向的偏移量至PriorBox层;/nPriorBox层输出的候选框坐标包括矩形候选框坐标与引入偏移的平行四边形候选框;/nPriorBox层计算平行四边形候选框的四个顶点坐标的方法为:/nx
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910857582.8/,转载请声明来源钻瓜专利网。