[发明专利]一种基于深度学习的图片垃圾识别方法在审

专利信息
申请号: 202011587571.1 申请日: 2020-12-29
公开(公告)号: CN112612914A 公开(公告)日: 2021-04-06
发明(设计)人: 徐风;于广建;于春峰;王金 申请(专利权)人: 浙江金实乐环境工程有限公司
主分类号: G06F16/55 分类号: G06F16/55;G06F16/583;G06K9/34;G06K9/38;G06K9/46;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 311258 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 图片 垃圾 识别 方法
【说明书】:

发明公开了一种基于深度学习的图片垃圾识别方法,包括以下步骤;步骤一、图像预处理;步骤二、图像分割;步骤三、图像尺寸调整;步骤四、对图像通过紧缩重排,形成新的图像字符;步骤五、将图像字符带入BP网络中,开展网络训练工作,从而将样本中的待识别的特征向量提取出来,随后进行识别工作得到潜在垃圾图片;步骤六、进行第二次过滤实现精确分类;步骤七、进行第三次过滤对垃圾图片进一步分类。本发明利用SVM算法结合图像底层特征实现粗分类,利用最近邻分类算法实现垃圾邮件精确分类,提出将图像型垃圾图片做进一步分类,提取垃圾图片的文本区域信息,利用最近邻分类算法,把垃圾图像分为正常类和垃圾类,可以进一步细分过滤垃圾图片。

技术领域

本发明涉及计算机图片处理技术领域,具体为一种基于深度学习的图片垃圾识别方法。

背景技术

21世纪,互联网不仅可以作为人与人之间的一种通讯方式,还成了资源传 输和共享手段,而手机作为终端处理器,不仅仅局限于通讯和发短信,人们还 可以利用手机更加快捷地获得所需要的信息,显然互联网对于人们的生活方式 起到了不少的促进作用,但互联网相比传统的媒体传播介质有所区别,互联网 显得更加难以管理。各种不良信息诸如垃圾图片等,也在互联网上肆意传输, 这给网络带来了很多不健康的信息,对网络使用者造成了伤害;

在电子邮件领域,垃圾邮件的花样不断翻新,需要反垃圾系统不断的更新技术来识别垃圾邮件,其中垃圾 图片的识别和过滤难度更大,图片垃圾或垃圾图片是指,在一张图片上含有被认为是垃圾信息的文字等, 例如卖发票、垃圾广告等信息,鉴于此,提出一种基于深度学习的图片垃圾识别方法。

发明内容

本发明的目的在于提供一种基于深度学习的图片垃圾识别方法,以解决上述背景技术中提出的问题。 为实现上述目的,本发明提供如下技术方案:一种基于深度学习的图片垃圾识别方法,包括以下步骤;

步骤一、图像预处理;

S1、利用微软图像函数库的dibapi.h及dibapi.cpp对图像数据进行读取;

S2、通过赋予图片像素点中的R、G、B各自一个加权系数,使各点分量的值相同,实现图片灰度化;

S3、对灰度图像进行二值化,根据自适应阈值法,将灰度图像的像素分化为黑或白两种颜色;

步骤二、图像分割;

S1、调整图像的整体倾斜度,按照由下至上的顺序,扫描图像,记录下第一个遇到的黑色的像素点;

S2、改变扫描的方向,按照由上而下,将第一个遇到的黑色像素点记录下来,这两个点之间的距离就是图 像大致的高度范围;

S3、进行图像分析,从左至右对图像进行扫描,发现第一个黑色像素点之后,将此点作为图像分割的起始 部位,接着进行扫描,无黑色像素点时停止完成分割;

步骤三、图像尺寸调整;

S1、对图像的归一化处理心扫描,之后对字符的尺寸进行调整,使其尺寸相同;

S2、对比系统要求高度与字符高度,将需变换的系数计算出来,依据此系数进行相应的高度变换,宽度也 按照此方法进行变化按照插值的方法,将新图像里的点映射到原图像中,完成尺寸统一;

步骤四、对图像通过紧缩重排,形成新的图像字符;

步骤五、将图像字符带入BP网络中,开展网络训练工作,从而将样本中的待识别的特征向量提取出来, 随后进行识别工作得到潜在垃圾图片;

步骤六、进行第二次过滤实现精确分类;

步骤七、进行第三次过滤对垃圾图片进一步分类。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江金实乐环境工程有限公司,未经浙江金实乐环境工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011587571.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top