[发明专利]内容过滤方法及内容过滤装置无效
申请号: | 200810186181.6 | 申请日: | 2008-12-19 |
公开(公告)号: | CN101441653A | 公开(公告)日: | 2009-05-27 |
发明(设计)人: | 陈波 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/38;G06K9/62 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 | 代理人: | 方 挺;王艳春 |
地址: | 518044广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内容 过滤 方法 装置 | ||
1、一种内容的过滤方法,包括:
将内容进行二值化处理;
获取所述二值化处理后的内容的特征值;和
根据所述特征值确定是否对所述内容进行过滤。
2、一种内容的过滤方法,包括:
将内容进行二值化处理;
获取所述二值化处理后的内容的特征值;
基于所述特征值,确定所述内容的置信概率;和
根据所述置信概率确定是否对所述内容进行过滤。
3、根据权利要求1或2所述的方法,其中所述内容为至少包含文字和图像之一的图片。
4、根据权利要求3所述的方法,其中所述内容的特征值包括所述图片的投影特性,和/或字符行的游程分布紧密性。
5、根据权利要求1、2或4所述的方法,其中所述内容的特征值还包括所述图片中字符大小的一致性,和/或字符颜色的单一性。
6、根据权利要求4所述的方法,其中
当以F1表示所述图片的投影特性时,按如下方式确定F1:
F1=波谷个数/图片高度,其中,波谷指所述图片在水平方向的投影累加和为零的投影,或所述图片在垂直方向的投影累加和为零的投影,图片高度以像素为单位;
在以F2表示所述字符行的游程分布紧密性时,按以下方式确定F2:
其中,nr表示所述图片中第r行黑色游程的个数,W是以像素为单位表示的图片宽度。
7、根据权利要求4、5或6所述的方法,其中所述置信概率以P表示时,通过以下方式获得P:
P(C=ci|A1=a1^Λ^An=an)=αP(C=ci)∏P(Ai|C=ci)。
其中,C表示类别变量,ci表示不同类别的常量,Ai表示图片的第i个特征值,α=1/P(A1=a1^Λ^An=an)。
8、根据权利要求4、5或6所述的方法,其中所述内容的置信概率选自以下任一种方式确定:
通过确定单个所述特征值对类别的后验概率来确定所述置信概率;
通过假定多个所述特征值相互独立,并对多个所述特征值的后验概率加权获得综合后的后验概率,来确定所述置信概率。
9、根据前述任一项权利要求所述的方法,其中所述二值化处理按如下方式进行:
T(x,y)=M(x,y)-Th (1)
其中,T(x,y)表示坐标为(x,y)的像素点的灰度阈值,M(x,y)表示坐标为(x,y)的像素点的局部平均灰度值,Th是固定经验阈值。
10、一种内容过滤装置,包括:
二值化模块,将内容进行二值化处理;
特征值获取模块,确定所述二值化处理后的内容的特征值;和
过滤模块,根据所述特征值确定是否对所述内容进行过滤。
11、一种内容过滤装置,包括:
二值化模块,将内容进行二值化处理;
特征值获取模块,确定所述二值化处理后的内容的特征值;
置信概率确定单元,根据所述内容特征值确定所述内容的置信概率;和
过滤模块,根据所述置信概率确定是否对所述内容进行过滤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810186181.6/1.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法