[发明专利]一种基于自注意力蒸馏的弱监督文字检测方法在审

专利信息
申请号: 202011320840.8 申请日: 2020-11-23
公开(公告)号: CN112418207A 公开(公告)日: 2021-02-26
发明(设计)人: 杨鹏;杨国为;韩志耕;吴平平;龚勋 申请(专利权)人: 南京审计大学
主分类号: G06K9/20 分类号: G06K9/20;G06K9/34;G06K9/62;G06N3/04
代理公司: 南京华恒专利代理事务所(普通合伙) 32335 代理人: 宋方园
地址: 211000 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 注意力 蒸馏 监督 文字 检测 方法
【权利要求书】:

1.一种基于自注意力蒸馏的弱监督文字检测方法,其特征在于:包括图片分类和图片检测,具体如下:

获取图片样本,并将图片样本中的含文字图片和不含文字图片分别标记为正负样本;对于获取后的正负样本采用VGGNet网络作为主干网络训练为基于弱监督的文字分类网络;

通过训练好的文字分类网络对待检测图片的输出信息进行筛选,筛选出包含有文字的文字候选区,然后根据文字候选区生成伪标注来训练文字检测网络,并通过自注意力蒸馏法提高文字检测网络检测文字精度。

2.根据权利要求1所述的基于自注意力蒸馏的弱监督文字检测方法,其特征在于:训练文字分类网络时,在VGGNet网络结构中的高层卷积层使用层次Inception模块,使其前后层的特征图分别进行下采样和上采样然后相结合生成FAIF,然后使用注意力SelfAttention模块沿特征通道使用池化操作压缩前述FAIF,再将调整尺寸后的新特征图与压缩后的FAIF点乘,最后通过全局平均池化完成图片分类。

3.根据权利要求1所述的基于自注意力蒸馏的弱监督文件检测方法,其特征在于:使用训练好的文字分类网络对待检测图片进行分类,即进行像素级判别,判断图片中是否含有文字;正样本中包括有文字计数。

4.根据权利要求1所述的基于自注意力蒸馏的弱监督文字检测方法,其特征在于:对待检测图片进行文字检测时,包括以下步骤:

(1)使用Edge Boxes法为输入的待检测图片生成一组候选区,将所有候选区输入到训练好的分类网络中计算其对比度分值CS,并根据对比度分值的大小进行排序:

其中,为给定候选框,是对应的图像,是将输入待检测图片中部分掩膜后的图像,pc表示输入为文字图像的概率;

如果值比较大,则意味着是文字区域的可能性大,然后选择对比度分值CS取值最大的前M个候选区作为正训练样本,而与之重叠的IoU在[0.1,0.5)的候选区作为负训练样本来训练文字检测器;

(2)使用CNN提取候选区特征来训练新的文字检测网络,该文字检测网络有两个输出分支;一个输出分支计算输入的待检测图片为文字图像的概率,另一个分支输出对文字窗口回归的坐标偏移。

5.根据权利要求1所述的基于自注意力蒸馏的弱监督文字检测方法,其特征在于:训练文字检测网络时在各迭代时间点均可通过注意力生成模块AGM使用自注意力蒸馏SAD进行迭代求精,使低层注意力热图从高层注意力热图获取有用的上下文信息;

上述迭代过程中,对应损失如下:

其中,Mfin(i)和Mfin(i+1)分别表示检测网络中相邻卷积层上AGM生成的注意力热图,P为使用注意力生成模块AGM的卷积层数目;

使用自注意力蒸馏SAD后,训练文字检测网络的总损失函数为:

L=Lmul+λ·Ldis,Lmul为两个输出分支的损失,λ用于调节使用SAD的权重。

6.根据权利要求5所述的基于自注意力蒸馏的弱监督文字检测方法,其特征在于:所述注意力生成模块AGM可适配分类和检测网络特征差异,其具体过程为:

令输入注意力生成模块AGM的特征图为其中H和W分别为特征图的长与宽,C为当前卷积层的通道数;

首先,对F沿通道使用平均池化,设Fj为第j个通道上的特征图,记

然后,对Matt进行sigmoid变换;

最后,将非线性热图与Matt相乘得到Mfin,Mfin进行适配分类和检测网络的特征差异。

7.根据权利要求1所述的基于自注意力蒸馏的弱监督文字检测方法,其特征在于:训练文字检测网络时将文字计数信息作为图像级监督信息中的一种,并在训练时先选择若干较大分数值的候选框,然后执行基于计数的区域选择算法CRS来得出最合适的候选框作为正训练样本调节文字检测网络。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京审计大学,未经南京审计大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011320840.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top