[发明专利]一种基于特征变量算法的图像内容信息分析方法在审
申请号: | 201611181751.3 | 申请日: | 2016-12-20 |
公开(公告)号: | CN106611193A | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 李慧 | 申请(专利权)人: | 太极计算机股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 变量 算法 图像 内容 信息 分析 方法 | ||
技术领域
本发明涉及图像内容信息分析技术领域,特别是一种基于特征变量算法的图像内容信息分析方法。
背景技术
随着互联网技术的发展,信息传播速度越来越快,在能够获取大量信息的同时,网络上肆意传播的低俗内容图片污染网络环境,如何能够快速准确地识别出含有低俗内容的图片是亟待解决的问题。目前的图片低俗成人检出方法,一般分为两类方法。一种是人工检测,此种方法需要人力成本大,检测速度慢,标准不一致,对于大量的互联网信息,效果并不理想;另一种方法是通过整幅图像的颜色进行简单判别,此类方法误判性高,使用效果差。
深度学习是机器学习里面的一个热门领域,起源于多层人工神经网络,目前已成功应用于计算机视觉。其中卷积神经网络在图像识别领域已经取得了令人瞩目的成就,相比传统的图片内容识别方法方法有了很大的提升。
简单的训练方法和结果处理模式并不能够满足多样的低俗图片内容检测需求,因此,研究一种适应于深度网络模型低俗内容的层级分类方法及结果优化策略对于低俗内容检测领域具有重要的研究价值和应用前景。
发明内容
本发明需要解决的技术问题是提供一种基于特征变量算法的图像内容信息分析方法。
为解决上述的技术问题,本发明的一种基于特征变量算法的图像内容信息分析方法,包括以下步骤,
(1)将所有的训练样本集图片根据需求分为多个一级大类,并在一级大类基础上二次划分为多个一级类;
(2)使用训练完成的深度网络模型对图片进行分类,模型计算得出的各类别置信度Pi,通过对比置信度差值P=PTOP1-PTOP2与阈值Th的关系,若P小于阈值Th,则根据PTOP1和PTOP2类别,进行相应的优化策略调整;若P大于阈值Th,则认为分类结果可信,不做调整,直接输出。
进一步的,步骤(1)中确定每个一级类下多个二级类的方法为应用聚类算法,提去样本图片的颜色信息和纹理信息作为聚类依据,确定最为合理地二级类分类方法。
进一步的,步骤(2)中阈值Th的计算方法为对于所有一级大类测试样本的分类结果,存在正确分类样本和错误分类样本,将所有正确分类样本置信度结果的前两位做差值并求和取平均得到正确分类样本的平均置信度差值;同样的,将所有错误分类样本置信度结果的前两位和做差值并求和取平均得到错误分类样本的平均置信度差值;分别计算正确分类样本的平均置信度差值和错误分类样本的平均置信度差值与惩罚系数的乘积,将两结果相加得到阈值。
更进一步的,步骤(2)中阈值Th的计算公式为:其中,为正确分类样本的平均置信度差值,为错误分类样本的平均置信度差值,α为错误惩罚系数。
更进一步的,确定所述平均置信度差值的公式为:其中,为样本的平均置信度差值,PTOP1为样本的置信度结果最高值,PTOP2为样本的置信度结果次高值,N为样本数量。
采用上述方法后,本发明应用多层级分类策略,将简单的正样本和负样本的二类划分方法细化,并使用聚类算法优化划分结果,得到二级类间距最大的划分方式,有助于加大类间区别,增加深度学习网络对图片特征的认识能力,提高整体识别精准度。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明层级分类及优化策略流程图。
图2为本发明阈值计算流程图。
具体实施方式
考虑到目前网络中有大量低俗和限制内容图片无法被精确快速检出过滤的问题,本发明使用了深度学习网络模型对图片内容进行识别分类,并引入层级分类以及结果优化策略对网络模型进行优化,大大提高了检测精度。
如图1所示,本发明一种基于特征变量算法的图像内容信息分析方法,在使用数据对深度网络模型进行训练之前,先对训练样本集进行层级分类处理,具体步骤如下:
(1)将所有的训练样本集图片根据需求分为多个一级大类,并在一级大类基础上二次划分为多个一级类;
(2)使用训练完成的深度网络模型对图片进行分类,模型计算得出的各类别置信度Pi,通过对比置信度差值P=PTOP1-PTOP2与阈值Th的关系,若P小于阈值Th,则根据PTOP1和PTOP2类别,进行相应的优化策略调整;若P大于阈值Th,则认为分类结果可信,不做调整,直接输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太极计算机股份有限公司,未经太极计算机股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611181751.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于大数据的图像分类方法
- 下一篇:一种基于RFID技术的图书入库新方法