[发明专利]基于深度玻尔兹曼机的电商网站违禁商品图片检测方法在审
申请号: | 201410315984.2 | 申请日: | 2014-07-03 |
公开(公告)号: | CN104063720A | 公开(公告)日: | 2014-09-24 |
发明(设计)人: | 陈纯;阮莹;宋明黎;张瑞;周星辰;卜佳俊 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66;G06K9/00;G06N3/02 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 杜军 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 玻尔兹曼机 网站 违禁 商品 图片 检测 方法 | ||
技术领域
本发明属于计算机视觉领域,涉及电商网站中违禁商品图片检测方法。
背景技术
随着电子商务的高速发展,越来越多的商品可以进行网上交易,一些法律违禁商品,也在电子商务平台上日益活跃,如枪支、刀具、药品等。为了逃避法律责任追究,贩卖违禁商品的卖家往往不会直接在商品名称上标注枪支、刀具等,而是将所卖物品以图片方式呈现,给清查过程带来很大难度,在目前的工业应用中也没有成熟的方法。因此,电商网站中违禁商品图片检测成为一个急需解决的问题。
传统的图片检测方法,特征提取都是基于浅层学习,使用深度学习方法进行图片检测的研究很少。与浅层学习相比,深度学习能够提取更好的图片特征,对数据有更本质的刻画,从而更利于图片的分类。
玻尔兹曼机是深度学习的一个典型应用。深度玻尔兹曼机(DBM,Deep Boltzmann Machine)模型是多个限制玻尔兹曼机(RBM,Restricted Boltzmann Machine)模型的叠加。RBM模型是一个两层结构、对称连接、层内无连接、层间全连接的无自反馈的随机神经网络模型,包括可见层和隐层。RBM模型在给定可见层(输入数据)时,各个隐层节点的激活概率相互独立;反之,在给定隐层时,各个可见层节点的激活概率相互独立。多个RBM模型堆叠:前一个RBM的隐层作为后一个RBM的可见层,构成DBM模型。
发明内容
本发明的主要目的是针对电商网站中出现的各类违禁商品图片,利用深度玻尔兹曼机模型实现一种简单有效的检测方法,在保证训练时间不大幅增加的基础上,提升违禁商品图片检测的准确率。
本发明提供了一种基于深度玻尔兹曼机的电商网站违禁商品图片检测方法,包括以下步骤:
1)采集图片数据,对图片数据进行预处理。
2)构建DBM模型,确定模型的层数,可见层、隐层节点数目。
3)训练DBM模型。
4)利用反向传播算法对步骤3)得到的DBM模型初始化参数微调。
5)利用滑动窗口方法在待检测图片上检测违禁商品,统计待检测图片的所有尺度所有窗口的判定结果,判断待检测图片中是否含有违禁商品,以及违禁商品位置。
所述的违禁商品图片检测方法适用于各类目标的检测,针对不同的检测目标,采集不同的图片数据。
所述的采集图片数据,以刀具检测为例。图片大小为200*200像素,刀具占据图片内容主体部分,图片数目10000张。
所述的图片数据预处理方法是将每张图片切分为只包含违禁商品的部分和只包含背景的部分,统一缩放为28*28像素大小的灰度图片。只包含刀具的灰度图片作为模型输入的正样本,只包含背景的灰度图片作为模型输入的负样本。取5000张的正样本和同等数目的负样本作为模型的训练集,取1500张的正样本和同等数目的负样本作为模型的测试集。
所述的构建DBM模型包括设置DBM模型层数,可见层、隐层节点数目。DBM层数越多,模型泛化能力越强,但训练耗时也越多,兼顾模型精度和训练时间,将DBM模型层数设置为3层;DBM模型可见层节点由图片样本本身28*28=784个像素以及图片中心区域10*10=100个像素的组合构成,共884个节点,我们认为,样本图片的中心区域包含的信息比边缘区域更丰富,叠加后能够增加中心区域部分的权重,利于DBM模型从图片样本中提取更鲁棒的特征;DBM模型隐层1节点数目为3000个,相当于将884个节点的可见层映射到3000个节点的隐层中,将可见层进一步展开,可以发现更多信息;隐层2节点数目为450个,相当于对隐层1结果进行采样,从中总结出有用信息。
所述的训练DBM模型是采用吉布斯交叉采样方法逐层训练,迭代次数为70次。
所述的DBM模型初始化参数微调是在DBM模型第二层隐层上增加2个节点的输出层,表示当前可见层接受的输入数据样本的所属类别,采用反向传播算法以及训练集、测试集数据对DBM模型进行迭代训练,迭代次数为50次,得到DBM模型的最终参数,即违禁商品图片检测的判别特征。
所述的滑动窗口方法是将待检测图片缩放到不同尺度,分别进行滑动窗口操作。滑动窗口大小设置为28*28,与DBM模型训练集、测试集样本大小一致,滑动窗口步长设置为2个像素,每次将滑动窗口中的图片内容转换为灰度图,作为DBM模型的可见层输入,结合微调后的参数,计算输出层结果,判定该窗口中当前图片部分是否是刀具。
本发明在保证训练时间不大幅增加的基础上,提升了图片检测的准确率。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410315984.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:脱机手写汉字的笔画还原方法及装置
- 下一篇:基于子模优化的物体识别方法