[发明专利]基于通道分组注意力机制的文本检测方法有效
申请号: | 202011442288.X | 申请日: | 2020-12-08 |
公开(公告)号: | CN112446372B | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 李宏亮;李泊琦;戚耀;钟子涵 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/18;G06V30/19;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 邹裕蓉 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 通道 分组 注意力 机制 文本 检测 方法 | ||
1.基于通道分组注意力机制的文本检测方法,其特征在于,包含以下步骤:
1)将待检测文本图像输入TextBoxes_plusplus网络,经过基于VGG16的主干网络,得到不同尺度下的预测特征谱;
2)从主干网络的隐藏层中选择原输入图像八分之一尺度特征谱作为预测特征谱;
3)预测特征谱基于注意力机制生成注意力热图;
4)将注意力热图与预测特征谱进行哈达马积得到优化后的预测特征谱;
5)将优化后的预测特征谱经由回归框偏移后输入PriorBox,将得到的预置框坐标作为检测出的文本位置;
注意力热图的生成方式为:预测特征谱作为注意力机制输入,通过全局池化与卷积实现降八维操作将特征谱压缩编码为原通道数的八分之一,再使用分组数为八的分组卷积完成解码,最后经过一次上采样得到与预测特征谱等大的注意力热图。
2.如权利要求1所述方法,其特征在于,隐藏层中选择原输入图像八分之一尺度特征谱为卷积层conv4-3输出的特征谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011442288.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种有内胎全钢子午线轮胎趾口结构
- 下一篇:一种海绵城市用装配式雨水收集装置