[发明专利]一种鉴别垃圾信息的方法、装置、存储介质和设备在审
申请号: | 201811343360.6 | 申请日: | 2018-11-13 |
公开(公告)号: | CN109451447A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 李佳;李强 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | H04W4/12 | 分类号: | H04W4/12;H04W12/12 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 房德权 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 非文本信息 存储介质 垃圾信息 预设规则 垃圾短信 信息鉴别 鉴别 | ||
本发明实施例提供了一种垃圾短信鉴别的方法、装置、存储介质和设备,所述方法包括:从待鉴别的信息中提取出非文本信息;判断所述非文本信息是否满足第一预设规则;如果所述非文本信息满足第一预设规则,将所述信息鉴别为垃圾信息。
技术领域
本发明涉及信息安全技术领域,尤其涉及一种鉴别垃圾信息的方法、装置、存储介质和设备。
背景技术
随着用户对信息安全的需求增长,垃圾信息鉴别技术也日益普及化和精准化。例如,基于伪基站发送的垃圾信息拦截率目前已接近100%,垃圾信息发送者想要通过伪基站成功将垃圾信息发送给用户已经十分困难了。而基于关键词、黑名单号码等鉴别方式也同样达到了准确率很高的水准。
然而在此情况下,垃圾信息发送者却开始逐渐将广告、骚扰、色情内容的文本和图片编辑为彩信发送给用户。由于现有技术针对垃圾信息的鉴别尚停留在短信,未涉及彩信,这就导致垃圾彩信几乎全部被漏检,进而导致垃圾彩信顺利进入正常信息列表并被用户查看。
因此,现有垃圾信息鉴别方法漏检率还很高。
发明内容
本发明实施例提供了一种鉴别垃圾信息的方法、装置、存储介质和设备,用于降低垃圾信息漏检率。
第一方面,本发明提供了一种鉴别垃圾信息的方法,包括:
从待鉴别的信息中提取出非文本信息;
判断所述非文本信息是否满足第一预设规则;
如果所述非文本信息满足第一预设规则,将所述信息鉴别为垃圾信息。
可选的,如果所述非文本信息包括图片,所述判断所述非文本信息是否满足第一预设规则,包括:
判断所述图片中是否包含预设特征元素;
如果所述图片包含所述预设特征元素,表示所述非文本信息满足所述第一预设规则。
可选的,如果所述非文本信息包括图片,所述判断所述非文本信息是否满足第一预设规则,包括:
判断所述图片对应的特征字符串是否包含预设字符串;
如果所述图片对应的特征字符串包含所述预设字符串,表示所述非文本信息满足所述第一预设规则。
可选的,所述方法还包括:
从所述信息中提取出文本信息;
判断所述文本信息是否满足第二预设规则;
如果所述非文本信息满足所述第一预设规则,和/或所述文本信息满足所述第二预设规则,将所述信息鉴别为垃圾信息。
可选的,如果所述非文本信息包括音频,所述判断所述非文本信息是否满足第一预设规则,包括:
将所述音频转化为子文本信息;
判断所述子文本信息是否满足所述第二预设条件;
如果所述子文本信息满足所述第二预设条件,表示所述非文本信息满足所述第一预设条件。
可选的,在所述从待鉴别的信息中提取出非文本信息之前,还包括:
从所述信息中提取所述信息的发送者号码;
判断所述发送者号码是否为异常号码;
如果所述发送者号码为所述异常号码,将所述信息鉴别为垃圾信息;如果所述发送者号码不为所述异常号码,则执行所述从待鉴别的信息中提取出非文本信息的步骤。
可选的,所述判断所述发送者号码是否为异常号码,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811343360.6/2.html,转载请声明来源钻瓜专利网。