[发明专利]一种文本广告图像的识别方法及装置有效
申请号: | 201410658664.7 | 申请日: | 2014-11-18 |
公开(公告)号: | CN104376304B | 公开(公告)日: | 2018-07-17 |
发明(设计)人: | 刘洁 | 申请(专利权)人: | 新浪网技术(中国)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许志勇 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 文本广告 联系信息 字符串 识别装置 有效识别 申请 | ||
本申请公开了一种文本广告图像的识别方法,以解决按照现有技术难以有效识别文本广告图像的问题。方法包括:确定图像中的包含联系信息的字符串;根据图像中包含联系信息的字符串的总数量,判断图像是否为文本广告图像。本申请还公开一种文本广告图像的识别装置。
技术领域
本申请涉及信息过滤技术,尤其涉及一种文本广告图像的识别方法及装置。
背景技术
近年来,针对垃圾邮件数量的急剧增长,研究人员已经提出了众多垃圾邮件检测方法。这些方法大多是基于文本内容的检测方法,如语义分析、文本聚类以及贝叶斯分类等方法。
为了逃避基于文本内容的反垃圾邮件系统的检测,垃圾邮件制造者采用了一种新的技术,即,将广告信息嵌入图像形成文本广告图像,从而传播带有文本广告图像的图像型垃圾邮件。
相比文本型垃圾邮件,图像型垃圾邮件会消耗更多带宽和存储资源,因此,图像型垃圾邮件爆发,给邮件系统带来了极大的负面影响。
由于文本广告图像的特点是图像中嵌入有大量的文字信息,因此,有研究人员提出利用光学字符识别(Optical Character Recognition,OCR)识别图像中的关键词,如“发票”或“开票”等;然后,若识别出的关键词在该图像中的出现频率高于一定阈值时,则确定该图像是文本广告图像,进而确定包含该图像的邮件是垃圾邮件。
上述识别方式存在的缺陷在于:
文本广告图像的制造者为了避免图像被识别出是文本广告图像,往往会对一些关键词进行处理,比如故意将关键词中的某个字写成错别字。针对这样的文本广告图像,采用OCR很难有效识别出文本广告图像。
发明内容
本申请实施例提供一种文本广告图像的识别方法,用于解决按照现有技术难以有效识别文本广告图像的问题。
本申请实施例还提供一种文本广告图像的识别装置,用于解决按照现有技术难以有效识别文本广告图像的问题。
一种文本广告图像的识别方法,包括:
确定图像中包含联系信息的字符串;根据图像中包含联系信息的字符串的总数量,判断图像是否为文本广告图像。
一种文本广告图像的识别装置,包括:确定单元,用于确定图像中包含联系信息的字符串;判断单元,用于根据图像中包含联系信息的字符串的总数量,判断图像是否为文本广告图像。
本申请实施例提供的上述至少一个方案能达到下述效果:
由于文本广告图像中往往会包含联系信息,而联系信息一般不会被文本广告图像制造者更改,或者仅会按照已知方式更改,因此以图像中包含联系信息的字符串的总数量作为判定图像是否为文本广告图像的依据,可以实现对文本广告图像的有效识别。
附图说明
图1为本申请实施例提供的文本广告图像的识别方法流程图;
图2为本申请实施例提供的文本广告图像的识别方法的实际应用流程图;
图3为本申请实施例提供的一种文本广告图像的识别装置结构示意图;
图4为本申请实施例提供的另一种文本广告图像的识别设备结构示意图。
具体实施方式
为了解决按照现有技术难以有效识别文本广告图像的问题,本申请实施例首先提供一种文本广告图像的识别方法,该方法的具体实现流程图如图1所示,包括下述步骤:
步骤S101、确定图像中包含联系信息的字符串。
这里所说的联系信息可以包括但不限于:手机号、电子邮箱地址、社交工具账号(如QQ号码或MSN账号等)等等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新浪网技术(中国)有限公司,未经新浪网技术(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410658664.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高精度加工主轴的在线动平衡测控系统
- 下一篇:用于机动车的冷却回路的泵
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序