[发明专利]文案区域识别方法和装置在审

申请号：	201810861942.7	申请日：	2018-08-01
公开（公告）号：	CN110796133A	公开（公告）日：	2020-02-14
发明（设计）人：	吴立薪;吕晶晶;包勇军;陈晓东	申请（专利权）人：	北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/34;G06N3/04
代理公司：	11038 中国国际贸易促进委员会专利商标事务所	代理人：	曹蓓;方亮
地址：	100195 北京市海淀区杏石口路6***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	联合解码特征信息像素信息多层区域识别边框图像处理技术旋转角度信息待处理图像方法和装置像素点信息准确度边框位置编码信息区域边框输出获取特征提取像素点输出分析图片
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种文案区域识别方法，包括：

提取待处理图像的多层的特征信息；

对多层的所述特征信息分别编码，并根据多层编码信息联合解码，获取联合解码输出；

根据所述联合解码输出获取像素信息，其中，所述像素信息包括每个像素点与文案区域的边框的距离及文案区域的旋转角度信息；

根据所述像素信息确定文案区域的边框位置。

2.根据权利要求1所述的方法，其中，所述根据联合解码输出获取像素信息包括：

将每个像素的联合解码输出与前一个像素或后一个像素的联合解码输出中的至少一个融合，获取融合解码信息；

根据所述融合解码信息输出获取像素信息。

3.根据权利要求1所述的方法，其中，所述多层的特征信息为通过卷积神经网络CNN提取。

4.根据权利要求1所述的方法，其中，所述对提取的特征分别编码包括：

将所述特征信息分别输入图卷积神经网络GCN，获取每层的编码信息。

5.根据权利要求4所述的方法，其中，

所述GCN将每个特征通过一个1*k的卷积后再通过一个k*1的卷积，获取第一编码，其中，所述k为预定常数；

将每个特征通过一个k*1的卷积后再通过一个1*k的卷积，获取第二编码；

将所述第一编码与所述第二编码求和，并卷积后输出，获取所述编码信息。

6.根据权利要求1所述的方法，其中，所述根据多层编码信息联合解码包括：

对最高层特征解码，获取最高层解码输出；

从高层到低层的顺序，利用上一层的解码输出和当前层的编码信息联合解码，并输出至下一层，直至所述当前层为最低层，输出所述联合解码信息。

7.根据权利要求6所述的方法，其中，所述利用上一层的解码输出和当前层的编码信息联合解码包括：

将当前层的编码信息采样2倍，并与上一层的解码输出拼接，卷积后输出。

8.根据权利要求2所述的方法，其中，

所述根据所述融合解码信息获取像素信息包括：

将所述融合解码信息通过深度为5的卷积获取每个像素点在四个方向上分别与文案区域的边框的距离，以及文案区域的旋转角度信息；

所述根据所述像素信息确定文案区域包括：

根据各个像素点在四个方向上分别与文案边框的距离，以及文案区域的旋转角度信息，通过非极大值抑制算法确定文案区域的边框位置。

9.根据权利要求8所述的方法，其中，所述根据所述融合解码信息获取像素信息还包括：

将所述融合解码信息通过深度为1的卷积获取每个像素点的位置是文案区域的概率；

所述根据所述像素信息确定文案区域还包括：

根据每个像素点位于所述文案区域的概率筛选出大于等于预定阈值的像素点；

所述通过非极大值抑制算法确定文案区域的边框位置为根据筛选出的像素点在四个方向上分别与文案边框的距离，以及文案区域的旋转角度信息，通过非极大值抑制算法确定文案区域的边框位置。

10.根据权利要求1所述的方法，还包括：

根据预定文案审核规则审核所述文案区域；

在所述文案区域不满足所述预定文案审核规则的情况下，驳回所述待处理图像对应的文案方案。

11.根据权利要求10所述的方法，其中，所述预定文案审核规则包括以下至少一种：

文案字号在预定字号范围内；或，

所述文案区域不占用预定保护区域。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司，未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810861942.7/1.html，转载请声明来源钻瓜专利网。

上一篇：会计原始凭证扫描识别及其业务处理一体化系统及方法
下一篇：一种强噪声复杂背景图像中的汉字组词方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]文案区域识别方法和装置在审

专利文献下载