[发明专利]一种对互联网大麻图像进行的过滤方法有效

专利信息
申请号: 200810239326.4 申请日: 2008-12-10
公开(公告)号: CN101751554A 公开(公告)日: 2010-06-23
发明(设计)人: 胡卫明;谢年华;吴偶 申请(专利权)人: 中国科学院自动化研究所
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;H04L29/06
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 梁爱荣
地址: 100080 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 互联网 大麻 图像 进行 过滤 方法
【说明书】:

技术领域

发明涉及计算机网络安全领域,特别涉及互联网敏感信息过滤方 法。

背景技术

随着互联网的飞速发展,毒品信息,特别是大麻贩售信息在互联网 快速的传播开来。许多不法网站利用网上购物的形式销售大麻,同时宣 扬大麻无害论,给社会造成了较大的危害。因此,正如过滤网络色情一 样,对毒品,特别是大麻信息的过滤已经成为当务之急。

从2001年1月1日开始,欧洲委员会启动了一项名为“网络保护 (NetProtect,NetProtect II)”的计划开发互联网多语言过滤系统,其搜集 的网页数据库包括色情、暴力、炸弹制作和毒品共4大类,研究人员主 要根据网页中的文本信息,尝试了文本处理领域的各种方法来对这四类 网页进行过滤。然而这项计划只采用了文本过滤技术,对于贩售大麻的 网站,由于其主要内容是图像和文字,过滤的效果就会大打折扣。

目前对毒品网站的识别还主要依靠文本过滤技术,对于毒品类图像 识别问题,目前还未见相关的研究。而从更广义上讲,毒品类图像的识 别实际上是计算机视觉领域中“物体类识别(object class recognition)”问 题的一个特例。物体类识别是由物体识别技术发展而来的。物体识别主 要的任务是区分本类物体中此物体与彼物体,例如人脸识别,其主要难 点是图像的视角、尺度、遮挡、光照等因素会严重的改变物体的信息, 给识别造成较大的困难。而物体类识别的主要任务是区分一类物体和其 它任何不属于此类的物体,其不仅继承了物体识别的所有难点,还要考 虑一类物体内部的变化信息。虽然这个问题很困难,却吸引了一批学者 对此问题进行了深入的研究,涌现出一系列有效的方法。

CVPR03上Fergus等人提出了一个概率模型,用一群已学习的部分 来表达一个物体类,然后用EM算法学习这个模型的参数。这个方法在 Caltech图像库上测试并取得了巨大的成功,因此在物体类识别领域作为 其它方法的标尺。

在物体识别领域学者们提出了很多基于局部特征的方法,典型的方 法包括一个兴趣点检测算法和一个局部特征描述子,这些局部特征一般 都是平移和平面旋转不变的。Mikolajczyk和Schmid总结并比较了几种局 部特征描述子,包括尺度不变特征变换(SIFT),steerable filters,differential invariants和moment invariants,结论是SIFT特征是效果最好的。

Opelt等人提出一个包含3种兴趣点检测算法和4种局部描述子的模 型,用Adaboost来挑选特征,进行物体类识别。Levi和Fink也采用了 相似的多特征的方法来识别。他们用Adaboost来挑选类Haar特征、方向 特征、甚至还有颜色特征。

物体类识别也可以用形状特征来完成。例如,Thureson和Carlsson 首先在图像中找出梯度方向,然后用这些梯度形成一个直方图特征。一 个物体的形状特征间接的定义为图像的梯度。两幅图像的相似度定义为 他们直方图的点乘。如果一幅图像和训练图像有足够的相似度,就认为 此图像属于某一类物体。

物体识别还可以利用特征的空间位置关系。Fergus等人用联合高斯 密度来描述特征位置的分布。Agarwal和Roth把每对检测的部位的空间 关系描述为一个二值的特征向量,然后把特征放入Winnows学习网络进 行学习。

2005年CVPR上Zhang等人提出了一个两层的boosting模型,用来 融合局部特征,形状特征和相对位置特征。首先对训练图像提取 PCA-SIFT和Shape Context组成一个特征库,用Adaboost挑选好的特征 组成第一层分类器;同时把这些挑选到的局部特征输入到第二层形成空 间位置特征(PSR),测试图像如果能通过这两层分类器就成功分类。这 种方法比较成功的融合了各种类型的特征,取得了不错的实验结果。但 是这种方法的PSR特征的实验效果并不是很令人满意,在处理图像背景 复杂的情况下反而起到负面效果。

物体类识别领域也有些利用图像内部自相似关系进行识别的方法。 Shechtman和Irani对图像中每个点提取周围的自相似信息,然后将局部 特征和相对位置一起考虑,用贝耶斯概率图模型来计算图像间的相似度, 取得了不错的实验结果。但是缺点是识别类似于穷举搜索,没有兴趣点 定位和尺度不变的性质,计算量非常大。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810239326.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top