[发明专利]文案区域识别方法和装置在审
申请号: | 201810861942.7 | 申请日: | 2018-08-01 |
公开(公告)号: | CN110796133A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 吴立薪;吕晶晶;包勇军;陈晓东 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06N3/04 |
代理公司: | 11038 中国国际贸易促进委员会专利商标事务所 | 代理人: | 曹蓓;方亮 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联合解码 特征信息 像素信息 多层 区域识别 边框 图像处理技术 旋转角度信息 待处理图像 方法和装置 像素点信息 准确度 边框位置 编码信息 区域边框 输出获取 特征提取 像素点 输出 分析 图片 | ||
本公开提出一种文案区域识别方法和装置,涉及图像处理技术领域。本公开的一种文案区域识别方法包括:提取待处理图像的多层的特征信息;对多层的特征信息分别编码,并根据多层编码信息联合解码,获取联合解码输出;根据联合解码输出获取像素信息,其中,像素信息包括每个像素点与文案区域的边框的距离及文案区域的旋转角度信息;根据像素信息确定文案区域的边框位置。通过这样的方法,能够通过特征提取获取多深度的特征信息,并通过编码和联合解码,同时考虑各个深度的特征,进而通过像素点信息的获取和分析实现文案区域边框位置的确定,提高识别图片中文案区域的速度和准确度。
技术领域
本公开涉及图像处理技术领域,特别是一种文案区域识别方法和装置。
背景技术
电商网站每天有大量的商品广告在站内和站外以图片的形式进行展现,这些广告图片的存量达到百亿级别,同时每天的增量至少达到几十万量级。为了提高图片广告的点击率和转化率,平台会制定图片的文案设计规范,并在用户上传图片后进行人工审核,这一过程往往需要耗费大量的时间和人力。
发明内容
本公开的一个目的在于提高了识别图片中文案区域的速度和准确度。
根据本公开一些实施例,提出一种文案区域识别方法,包括:提取待处理图像的多层的特征信息;对多层的特征信息分别编码,并根据多层编码信息联合解码,获取联合解码输出;根据联合解码输出获取像素信息,其中,像素信息包括每个像素点与文案区域的边框的距离及文案区域的旋转角度信息;根据像素信息确定文案区域的边框位置。
在一些实施例中,根据联合解码输出获取像素信息包括:将每个像素的联合解码输出与前一个像素或后一个像素的联合解码输出中的至少一个融合,获取融合解码信息;根据融合解码信息输出获取像素信息。
在一些实施例中,多层的特征信息为通过CNN(Convolutional Neural Network,卷积神经网络)提取。
在一些实施例中,对提取的特征分别编码包括:将特征信息分别输入GCN(GraphConvolutional Network,图卷积神经网络),获取每层的编码信息。
在一些实施例中,GCN将每个特征通过一个1*k的卷积后再通过一个k*1的卷积,获取第一编码,其中,k为预定常数;将每个特征通过一个k*1的卷积后再通过一个1*k的卷积,获取第二编码;将第一编码与第二编码求和,并卷积后输出,获取编码信息。
在一些实施例中,根据多层编码信息联合解码包括:对最高层特征解码,获取最高层解码输出;从高层到低层的顺序,利用上一层的解码输出和当前层的编码信息联合解码,并输出至下一层,直至当前层为最低层,输出联合解码信息。
在一些实施例中,利用上一层的解码输出和当前层的编码信息联合解码包括:将当前层的编码信息采样2倍,并与上一层的解码输出拼接,卷积后输出。
在一些实施例中,根据融合解码信息获取像素信息包括:将融合解码信息通过深度为5的卷积获取每个像素点在四个方向上分别与文案区域的边框的距离,以及文案区域的旋转角度信息;根据像素信息确定文案区域包括:根据各个像素点在四个方向上分别与文案边框的距离,以及文案区域的旋转角度信息,通过非极大值抑制算法确定文案区域的边框位置。
在一些实施例中,根据融合解码信息获取像素信息还包括:将融合解码信息通过深度为1的卷积获取每个像素点的位置是文案区域的概率;根据像素信息确定文案区域还包括:根据每个像素点位于文案区域的概率筛选出大于等于预定阈值的像素点;通过非极大值抑制算法确定文案区域的边框位置为:根据筛选出的像素点在四个方向上分别与文案边框的距离,以及文案区域的旋转角度信息,通过非极大值抑制算法确定文案区域的边框位置。
在一些实施例中,文案区域识别方法还包括:根据预定文案审核规则审核文案区域;在文案区域不满足预定文案审核规则的情况下,驳回待处理图像对应的文案方案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810861942.7/2.html,转载请声明来源钻瓜专利网。