[发明专利]一种基于深度学习的图片垃圾识别方法在审

申请号：	202011587571.1	申请日：	2020-12-29
公开（公告）号：	CN112612914A	公开（公告）日：	2021-04-06
发明（设计）人：	徐风;于广建;于春峰;王金	申请（专利权）人：	浙江金实乐环境工程有限公司
主分类号：	G06F16/55	分类号：	G06F16/55;G06F16/583;G06K9/34;G06K9/38;G06K9/46;G06K9/62
代理公司：	暂无信息	代理人：	暂无信息
地址：	311258 浙江省***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习图片垃圾识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于深度学习的图片垃圾识别方法，包括以下步骤；步骤一、图像预处理；步骤二、图像分割；步骤三、图像尺寸调整；步骤四、对图像通过紧缩重排，形成新的图像字符；步骤五、将图像字符带入BP网络中，开展网络训练工作，从而将样本中的待识别的特征向量提取出来，随后进行识别工作得到潜在垃圾图片；步骤六、进行第二次过滤实现精确分类；步骤七、进行第三次过滤对垃圾图片进一步分类。本发明利用SVM算法结合图像底层特征实现粗分类，利用最近邻分类算法实现垃圾邮件精确分类，提出将图像型垃圾图片做进一步分类，提取垃圾图片的文本区域信息，利用最近邻分类算法，把垃圾图像分为正常类和垃圾类，可以进一步细分过滤垃圾图片。

技术领域

本发明涉及计算机图片处理技术领域，具体为一种基于深度学习的图片垃圾识别方法。

背景技术

21世纪，互联网不仅可以作为人与人之间的一种通讯方式，还成了资源传输和共享手段，而手机作为终端处理器，不仅仅局限于通讯和发短信，人们还可以利用手机更加快捷地获得所需要的信息，显然互联网对于人们的生活方式起到了不少的促进作用，但互联网相比传统的媒体传播介质有所区别，互联网显得更加难以管理。各种不良信息诸如垃圾图片等，也在互联网上肆意传输，这给网络带来了很多不健康的信息，对网络使用者造成了伤害；

在电子邮件领域，垃圾邮件的花样不断翻新，需要反垃圾系统不断的更新技术来识别垃圾邮件，其中垃圾图片的识别和过滤难度更大，图片垃圾或垃圾图片是指，在一张图片上含有被认为是垃圾信息的文字等，例如卖发票、垃圾广告等信息，鉴于此，提出一种基于深度学习的图片垃圾识别方法。

发明内容

本发明的目的在于提供一种基于深度学习的图片垃圾识别方法，以解决上述背景技术中提出的问题。为实现上述目的，本发明提供如下技术方案：一种基于深度学习的图片垃圾识别方法，包括以下步骤；

步骤一、图像预处理；

S1、利用微软图像函数库的dibapi.h及dibapi.cpp对图像数据进行读取；

S2、通过赋予图片像素点中的R、G、B各自一个加权系数，使各点分量的值相同，实现图片灰度化；

S3、对灰度图像进行二值化，根据自适应阈值法，将灰度图像的像素分化为黑或白两种颜色；

步骤二、图像分割；

S1、调整图像的整体倾斜度，按照由下至上的顺序，扫描图像，记录下第一个遇到的黑色的像素点；

S2、改变扫描的方向，按照由上而下，将第一个遇到的黑色像素点记录下来，这两个点之间的距离就是图像大致的高度范围；

S3、进行图像分析，从左至右对图像进行扫描，发现第一个黑色像素点之后，将此点作为图像分割的起始部位，接着进行扫描，无黑色像素点时停止完成分割；

步骤三、图像尺寸调整；