[发明专利]文案区域识别方法和装置在审
申请号: | 201810861942.7 | 申请日: | 2018-08-01 |
公开(公告)号: | CN110796133A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 吴立薪;吕晶晶;包勇军;陈晓东 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06N3/04 |
代理公司: | 11038 中国国际贸易促进委员会专利商标事务所 | 代理人: | 曹蓓;方亮 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联合解码 特征信息 像素信息 多层 区域识别 边框 图像处理技术 旋转角度信息 待处理图像 方法和装置 像素点信息 准确度 边框位置 编码信息 区域边框 输出获取 特征提取 像素点 输出 分析 图片 | ||
1.一种文案区域识别方法,包括:
提取待处理图像的多层的特征信息;
对多层的所述特征信息分别编码,并根据多层编码信息联合解码,获取联合解码输出;
根据所述联合解码输出获取像素信息,其中,所述像素信息包括每个像素点与文案区域的边框的距离及文案区域的旋转角度信息;
根据所述像素信息确定文案区域的边框位置。
2.根据权利要求1所述的方法,其中,所述根据联合解码输出获取像素信息包括:
将每个像素的联合解码输出与前一个像素或后一个像素的联合解码输出中的至少一个融合,获取融合解码信息;
根据所述融合解码信息输出获取像素信息。
3.根据权利要求1所述的方法,其中,所述多层的特征信息为通过卷积神经网络CNN提取。
4.根据权利要求1所述的方法,其中,所述对提取的特征分别编码包括:
将所述特征信息分别输入图卷积神经网络GCN,获取每层的编码信息。
5.根据权利要求4所述的方法,其中,
所述GCN将每个特征通过一个1*k的卷积后再通过一个k*1的卷积,获取第一编码,其中,所述k为预定常数;
将每个特征通过一个k*1的卷积后再通过一个1*k的卷积,获取第二编码;
将所述第一编码与所述第二编码求和,并卷积后输出,获取所述编码信息。
6.根据权利要求1所述的方法,其中,所述根据多层编码信息联合解码包括:
对最高层特征解码,获取最高层解码输出;
从高层到低层的顺序,利用上一层的解码输出和当前层的编码信息联合解码,并输出至下一层,直至所述当前层为最低层,输出所述联合解码信息。
7.根据权利要求6所述的方法,其中,所述利用上一层的解码输出和当前层的编码信息联合解码包括:
将当前层的编码信息采样2倍,并与上一层的解码输出拼接,卷积后输出。
8.根据权利要求2所述的方法,其中,
所述根据所述融合解码信息获取像素信息包括:
将所述融合解码信息通过深度为5的卷积获取每个像素点在四个方向上分别与文案区域的边框的距离,以及文案区域的旋转角度信息;
所述根据所述像素信息确定文案区域包括:
根据各个像素点在四个方向上分别与文案边框的距离,以及文案区域的旋转角度信息,通过非极大值抑制算法确定文案区域的边框位置。
9.根据权利要求8所述的方法,其中,所述根据所述融合解码信息获取像素信息还包括:
将所述融合解码信息通过深度为1的卷积获取每个像素点的位置是文案区域的概率;
所述根据所述像素信息确定文案区域还包括:
根据每个像素点位于所述文案区域的概率筛选出大于等于预定阈值的像素点;
所述通过非极大值抑制算法确定文案区域的边框位置为根据筛选出的像素点在四个方向上分别与文案边框的距离,以及文案区域的旋转角度信息,通过非极大值抑制算法确定文案区域的边框位置。
10.根据权利要求1所述的方法,还包括:
根据预定文案审核规则审核所述文案区域;
在所述文案区域不满足所述预定文案审核规则的情况下,驳回所述待处理图像对应的文案方案。
11.根据权利要求10所述的方法,其中,所述预定文案审核规则包括以下至少一种:
文案字号在预定字号范围内;或,
所述文案区域不占用预定保护区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810861942.7/1.html,转载请声明来源钻瓜专利网。