[发明专利]一种基于深度学习的图片垃圾识别方法在审
申请号: | 202011587571.1 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112612914A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 徐风;于广建;于春峰;王金 | 申请(专利权)人: | 浙江金实乐环境工程有限公司 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06F16/583;G06K9/34;G06K9/38;G06K9/46;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 311258 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 图片 垃圾 识别 方法 | ||
本发明公开了一种基于深度学习的图片垃圾识别方法,包括以下步骤;步骤一、图像预处理;步骤二、图像分割;步骤三、图像尺寸调整;步骤四、对图像通过紧缩重排,形成新的图像字符;步骤五、将图像字符带入BP网络中,开展网络训练工作,从而将样本中的待识别的特征向量提取出来,随后进行识别工作得到潜在垃圾图片;步骤六、进行第二次过滤实现精确分类;步骤七、进行第三次过滤对垃圾图片进一步分类。本发明利用SVM算法结合图像底层特征实现粗分类,利用最近邻分类算法实现垃圾邮件精确分类,提出将图像型垃圾图片做进一步分类,提取垃圾图片的文本区域信息,利用最近邻分类算法,把垃圾图像分为正常类和垃圾类,可以进一步细分过滤垃圾图片。
技术领域
本发明涉及计算机图片处理技术领域,具体为一种基于深度学习的图片垃圾识别方法。
背景技术
21世纪,互联网不仅可以作为人与人之间的一种通讯方式,还成了资源传 输和共享手段,而手机作为终端处理器,不仅仅局限于通讯和发短信,人们还 可以利用手机更加快捷地获得所需要的信息,显然互联网对于人们的生活方式 起到了不少的促进作用,但互联网相比传统的媒体传播介质有所区别,互联网 显得更加难以管理。各种不良信息诸如垃圾图片等,也在互联网上肆意传输, 这给网络带来了很多不健康的信息,对网络使用者造成了伤害;
在电子邮件领域,垃圾邮件的花样不断翻新,需要反垃圾系统不断的更新技术来识别垃圾邮件,其中垃圾 图片的识别和过滤难度更大,图片垃圾或垃圾图片是指,在一张图片上含有被认为是垃圾信息的文字等, 例如卖发票、垃圾广告等信息,鉴于此,提出一种基于深度学习的图片垃圾识别方法。
发明内容
本发明的目的在于提供一种基于深度学习的图片垃圾识别方法,以解决上述背景技术中提出的问题。 为实现上述目的,本发明提供如下技术方案:一种基于深度学习的图片垃圾识别方法,包括以下步骤;
步骤一、图像预处理;
S1、利用微软图像函数库的dibapi.h及dibapi.cpp对图像数据进行读取;
S2、通过赋予图片像素点中的R、G、B各自一个加权系数,使各点分量的值相同,实现图片灰度化;
S3、对灰度图像进行二值化,根据自适应阈值法,将灰度图像的像素分化为黑或白两种颜色;
步骤二、图像分割;
S1、调整图像的整体倾斜度,按照由下至上的顺序,扫描图像,记录下第一个遇到的黑色的像素点;
S2、改变扫描的方向,按照由上而下,将第一个遇到的黑色像素点记录下来,这两个点之间的距离就是图 像大致的高度范围;
S3、进行图像分析,从左至右对图像进行扫描,发现第一个黑色像素点之后,将此点作为图像分割的起始 部位,接着进行扫描,无黑色像素点时停止完成分割;
步骤三、图像尺寸调整;
S1、对图像的归一化处理心扫描,之后对字符的尺寸进行调整,使其尺寸相同;
S2、对比系统要求高度与字符高度,将需变换的系数计算出来,依据此系数进行相应的高度变换,宽度也 按照此方法进行变化按照插值的方法,将新图像里的点映射到原图像中,完成尺寸统一;
步骤四、对图像通过紧缩重排,形成新的图像字符;
步骤五、将图像字符带入BP网络中,开展网络训练工作,从而将样本中的待识别的特征向量提取出来, 随后进行识别工作得到潜在垃圾图片;
步骤六、进行第二次过滤实现精确分类;
步骤七、进行第三次过滤对垃圾图片进一步分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江金实乐环境工程有限公司,未经浙江金实乐环境工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011587571.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种对接机构及自动对接装置
- 下一篇:一种天然气调压器引压装置及调压方法