[发明专利]分类器的训练方法及装置、识别敏感图片的方法及装置有效
申请号: | 200810198788.6 | 申请日: | 2008-09-26 |
公开(公告)号: | CN101359372A | 公开(公告)日: | 2009-02-04 |
发明(设计)人: | 付立波;王建宇;陈波 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 广州华进联合专利商标代理有限公司 | 代理人: | 曾旻辉 |
地址: | 518044广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 训练 方法 装置 识别 敏感 图片 | ||
1.一种敏感图片分类器的训练方法,其特征在于,包括步骤:
提取训练图片集的区域形状特征,所述训练图片集包括正例样本集、第一反例样本集和第二反例样本集;
测量所述区域形状特征在所述正例样本集、第一反例样本集和第二反例样本集中的分布特征;
根据所述分布特征确定所述区域形状特征的可分性;
将相对于所述正例样本集与所述第一反例样本集具有可分性的区域形状特征标注为第一特征组;将相对于所述正例样本集与所述第二反例样本集具有可分性的区域形状特征标注为第二特征组;
通过所述第一特征组训练获得第一分类器,通过所述第二特征组训练获得第二分类器。
2.根据权利要求1所述的敏感图片分类器的训练方法,其特征在于,所述第一反例样本集由场景图片组成,所述第一特征组包括至少一项以下区域形状特征:
皮肤区域Hu矩的前3个分量,最大皮肤块的Zernike前4阶矩中的Z22、Z40、Z42,最大皮肤块的Fourier描述子高频分量、曲率能量、近矩形性。
3.根据权利要求1所述的敏感图片分类器的训练方法,其特征在于,所述第一特征组包括至少一项以下区域形状特征:
最大皮肤块的Zernike矩中的Z11、最大皮肤块的偏心率。
4.根据权利要求1所述的敏感图片分类器的训练方法,其特征在于,所述第一特征组包括至少一项以下区域形状特征:
最大皮肤块与图像面积比、紧凑性、边缘像素的密度。
5.根据权利要求1至4中任一项所述的敏感图片分类器的训练方法,其特征在于:根据所述分布特征确定所述区域形状特征的可分性的步骤包括:
分别统计所述区域形状特征在所述正例样本集、第一反例样本集和第二反例样本集中的分布直方图;
对所述分布直方图进行归一化,并确定归一化后的直方图的相交比;
根据所述相交比确定所述区域形状特征的可分性。
6.根据权利要求5所述的敏感图片分类器的训练方法,其特征在于:所述第一分类器或第二分类器为Bayes分类器,所述Bayes分类器的形式为:
其中,cj,j=1,2分别表示正例和第一反例时,x1x2...xN是所述第一特征组的N维区域形状特征向量;P(cj|x1x2...xN)为所述第一特征组的特征向量x1x2...xN属于正例或第一反例的后验概率;cj,j=1,2分别表示正例和第二反例时,x1x2...xN是所述第二特征组的N维区域形状特征向量;P(cj|x1x2...xN)为第二特征组的特征向量x1x2...xN属于正例或第二反例的后验概率;P(cj)为正例或第一反例或第二反例的先验概率;P(cj|xi)表示所述区域形状特征向量的各维属于类cj的概率;P(xi|cj)为所述区域形状特征向量的各维在正例或第一/第二反例中的概率分布;
通过在所述正例样本集和第一/第二反例样本集上估计所述先验概率P(cj)和统计第一/第二特征组的区域形状特征向量的各维在正例或第一/第二反例中的概率分布P(xi|cj),得到第一或第二分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810198788.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:测试网络设备的方法、系统及装置
- 下一篇:电子化学痕量检测器