[发明专利]海量网络文本与非文本图像分类方法有效

专利信息
申请号: 201610541508.1 申请日: 2016-07-12
公开(公告)号: CN106257496B 公开(公告)日: 2019-06-07
发明(设计)人: 白翔;石葆光;章成全 申请(专利权)人: 华中科技大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 华中科技大学专利中心 42201 代理人: 梁鹏
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种海量网络文本与非文本图像分类方法,首先构建多尺度空间划分网络,然后对训练图像集中的图像,获取图像的多尺度图像块标签信息,并根据构建的多尺度空间划分网络,利用标注好的训练数据集训练多尺度空间划分网络的网络参数,然后利用构建的多尺度空间划分网络以及训练得到的网络参数,对待测试的大规模网络图像进行分类,最终获取图像的分类结果,对图像是否为文本图像做出判决,并获取文本区域在图像中的大致位置。本发明方法文本与非文本图像分类准确率高,且有很高的分类效率。
搜索关键词: 海量 网络 文本 图像 分类 方法
【主权项】:
1.一种海量网络文本与非文本图像分类方法,其特征在于,所述方法包含下述步骤:(1)多尺度空间划分网络构建,包括:(1.1)定义多层次特征图生成子网络网络结构;(1.2)定义多尺度图像块特征生成子网络网络结构;(1.3)定义文本与非文本图像块分类子网络网络结构;(1.4)构建多尺度空间划分网络;其中对于(1.1)定义多层次特征图生成子网络网络结构,该(1.1)定义多层次特征图生成子网络网络结构的过程具体为:(1.1.1)定义图像特征提取网络结构:所述的图像特征提取网络结构包括五个卷积阶段,其中第一个和第二个卷积阶段的网络结构均为两个卷积层和一个最大池化层,最后三个卷积阶段的网络结构均为三个卷积层和一个最大池化层,对输入图像I,经过该图像特征提取网络得到各个卷积阶段的输出特征图,记为其中表示第s个卷积阶段的输出的特征图序列,Ms,m表示第m个特征图,MNums为预设的第s个卷积阶段输出特征图的个数;(1.1.2)定义多层次特征图生成子网络网络结构:对步骤(1.1.1)中所述的图像特征提取网络的后三个卷积阶段之后分别接一个反卷积层,将这三个卷积阶段的输出中的所有特征图的尺度全部缩放到Wm×Hm大小,所得尺度缩放后的特征图序列记为其中Wm和Hm分别表示预设的特征图尺度缩放后特征图宽度和高度,表示第s个卷积阶段的输出特征图序列FMs中的每个特征图经过尺度缩放后得到的特征图序列,M′s,m表示FMs中第m个特征图经过尺度缩放后得到的特征图;之后将FMS′中的所有特征图进行堆叠,得到多层次特征图,记为其中M″c表示图像的多层次特征图的第c个特征图,MNum=MNum3+MNum4+MNum5,且表示多层次特征图中特征图个数;对于(1.2)定义多尺度图像块特征生成子网络网络结构,该(1.2)定义多尺度图像块特征生成子网络网络结构的过程具体为:(1.2.1)单一尺度图像块空间划分:对步骤(1.1)所述的多层次特征图生成子网络得到的图像多层次特征图F,将多层次特征图划分为尺度为的图像块,划分方法表示为:将多层次特征图划分为SP=sp×sp个图像块,对于划分的一个图像块Fij,在输入图像I中对应的图像块Iij计算方法为:其中Fij表示将多层次特征图进行图像块划分后在第i列、第j行的图像块,x和y分别表示像素点在图像块中的横坐标和纵坐标,Wm和Hm分别表示多层次特征图的宽度和高度,W和H分别表示输入图像I的宽度和高度,sp为预设的图像块划分尺度;(1.2.2)多尺度图像块空间划分:预设多个不同的图像块划分尺度,记为对其中的每个划分尺度spk,按照步骤(1.2.1)所述的方法,对多层次特征图F进行图像块空间划分,得到SPk=spk×spk个图像块,通过多尺度图像块空间划分,得到的所有图像块序列为PS,且其中Patchn表示第n个图像块,且表示图像块总数;(1.2.3)多尺度图像块特征提取:对步骤(1.2.2)中对多层次特征图F进行多尺度图像块空间划分得到的图像块序列PS中的每一个图像块Patch,将图像块按行和列分别分割为Nsp份,则每个图像块Patch分割为SPNum=Nsp×Nsp个子图像块,记为其中SubPnsp表示第nsp个子图像块,然后利用一个最大池化层将每个子图像块转换为该子图像块对应的特征向量,则得到每个图像块Patch对应的子图像块特征向量序列,记为其中SubVnsp表示第nsp个子图像块对应的特征向量,特征向量长度即为所述步骤(1.1.2)中所得的多层次特征图中特征图个数MNum,将图像块中所有子图像块对应的特征向量进行拼接,得到图像块对应的特征向量,记为V=[SubV1,...,SubVSPNum],则图像块特征向量长度为MNum×SPNum,对多尺度图像块空间划分得到的每一个图像块按上述方法提取图像块的特征向量,得到所有图像块的特征向量集合,记为其中Vn表示第n个图像块对应的特征向量;(2)多尺度空间划分网络训练,包括:(2.1)对训练图像集中的每一张图像,获取多尺度图像块标签信息;(2.2)根据所述多尺度图像块标签信息训练得到多尺度空间划分网络的参数;(3)文本与非文本图像分类:根据多尺度空间划分网络的参数,利用所述多尺度空间划分网络对待识别文本或者非文本图像进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610541508.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top