[发明专利]基于卷积神经网络的广告骚扰传真图像检测系统及方法有效
申请号: | 201810150076.0 | 申请日: | 2018-02-13 |
公开(公告)号: | CN108460772B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 高圣翔;万辛;黄远;李鹏;安茂波;孙晓晨;计哲;邓文兵;沈亮;侯炜 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/136;G06T7/155;G06V10/764;G06K9/62 |
代理公司: | 北京力量专利代理事务所(特殊普通合伙) 11504 | 代理人: | 李之壮 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 广告 骚扰 传真 图像 检测 系统 方法 | ||
1.一种基于卷积神经网络的广告骚扰传真图像检测系统,其特征在于,包括:
关键字区域提取模块,所述关键字区域提取模块用于确定待检测传真图像的关键字可疑区域;
神经网络置信度分析模块,所述神经网络置信度分析模块与所述关键字区域提取模块相连,所述神经网络置信度分析模块用于对所述关键字可疑区域的文字进行分类;
所述关键字区域提取模块包括二值化模块和形态学腐蚀模块;所述二值化模块用于对所述关键字可疑区域进行判断;所述形态学腐蚀模块与所述二值化模块相连,所述形态学腐蚀模块用于对判断后的所述关键字可疑区域进行腐蚀;
所述神经网络置信度分析模块包括输入层、第一卷积模块、第二卷积模块、第三卷积模块、第四卷积模块、第五卷积模块和神经网络特征分类器;
所述神经网络置信度分析模块包括23层,所述输入层为所述神经网络置信度分析模块的第1层;所述第一卷积模块为所述神经网络置信度分析模块的第2至4层;所述第二卷积模块为所述神经网络置信度分析模块的第5至7层;所述第三卷积模块为所述神经网络置信度分析模块的第8至11层;所述第四卷积模块为所述神经网络置信度分析模块的第12至15层;所述第五卷积模块为所述神经网络置信度分析模块的第16至19层;所述神经网络特征分类器为所述神经网络置信度分析模块的第20至23层;
所述第一卷积模块、所述第二卷积模块、所述第三卷积模块、所述第四卷积模块和所述第五卷积模块分别包括卷积层和池化层;
所述系统通过如下方法实现,所述方法包括:
步骤一:对所述神经网络置信度分析模块的卷积神经网络进行训练;
1.1求取初步训练模型;
选取包括预定数量汉字的数据集,每个汉字包括预定数量的图像,图像采集自不同的手写文本,并进行归一化处理,得到初步训练模型;
1.2模型的二次训练;
在1.1的基础上,采取迁移学习的方式,进行二次训练;对人工确定的广告骚扰传真图像,从标题位置手动切分出A,B,C,D等多个子图像,每个子图像为一个字符;对于每个子图像,顺时针45度旋转3次,并对每个位置做水平翻转,得到8×2张图像;随机在[224,386]之间选择一个大小,并将每张图像调整到这个大小,在其上获得一个大小为(224,224)的区域作为输入;
卷积神经网络训练的批量大小设为64,采用随机梯度下降算法;动量设置为0.9,最大迭代次数为10万次,初始学习率为0.05,每1万次衰减0.0005;L2正则化的L2正则系数为0.1,降低过拟合采用了dropout方式,概率设为0.5;
1.3获得完整的卷积神经网络训练集:
将1.2组成的训练集随机打乱,计算训练集图像的均值并进行去均值操作,处理后的结果为卷积神经网络的完整训练集;
步骤二:提取所述关键字可疑区域;
2.1基于OTSU的图像二值化操作:
二值化模块进行基于OTSU的图像二值化操作,采用最大类间方差法(OTSU)在待检测传真图像中选取一个最优二值化阈值,将待检测传真图像分为背景和目标,目标颜色置0(黑),背景颜色置255(白),从而达到二值化,能够使得目标和背景之间相同类别的差距最小,不同类别间的差距最大;
2.2基于形态学腐蚀的目标压缩;
2.3提取关键字可疑区域:
设需要识别的关键字集合为{A,B,C,D},从每一个集合元素中随机选择一张待检测传真图像作为区域模板,经过步骤1.1和步骤1.2处理后,将所有模板求并得到关键字可疑区域;
步骤三:使用训练后的所述神经网络置信度分析模块对所述关键字可疑区域进行识别判断。
2.根据权利要求1所述的基于卷积神经网络的广告骚扰传真图像检测系统,其特征在于:
所述神经网络特征分类器对所述关键字可疑区域设有关键字置信度,所述关键字可疑区域的文字判断为关键词序列时,则判断所述待检测传真图像为广告骚扰图像,否则为正常图像。
3.根据权利要求2所述的基于卷积神经网络的广告骚扰传真图像检测系统,其特征在于:
在步骤三中,所述输入层输入所述关键字可疑区域,所述第一卷积模块、所述第二卷积模块、所述第三卷积模块、所述第四卷积模块和所述第五卷积模块依次对所述关键字可疑区域进行处理,所述神经网络特征分类器对所述关键字可疑区域进行判断。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810150076.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防范区域目标监控方法及系统
- 下一篇:应用于共享式以太网的分式调度方法