[发明专利]识别垃圾短信的方法及装置无效
申请号: | 201210320796.X | 申请日: | 2012-08-31 |
公开(公告)号: | CN102833713A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 周桂英 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | H04W4/14 | 分类号: | H04W4/14;H04W12/12 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 垃圾 短信 方法 装置 | ||
1.一种识别垃圾短信的方法,其特征在于,包括:
获取发送短信源号码对应的多条待检测短信;
从所述待检测短信中选取一条作为基准检验短信,并将所述待检测短信中除去所述基准检验短信之外的各条短信作为待比较短信;
从所述基准检验短信中抽取待比较词汇;
根据所述待比较词汇和所述待比较短信,获取所述发送短信源号码的内容相似度;
当所述内容相似度大于第一预设阈值时,将所述发送短信源号码对应的所有短信识别为垃圾短信。
2.根据权利要求1所述的识别垃圾短信的方法,其特征在于,当所述内容相似度大于第一预设阈值之后,且在将所述发送短信源号码对应的所有短信识别为垃圾短信之前,还包括:
根据预设的垃圾词库判断所述待比较词汇中的垃圾词汇是否大于预设垃圾词汇阈值;
当判断结果为是时,执行将所述发送短信号码对应的所有短信识别为垃圾短信的操作。
3.根据权利要求1所述的识别垃圾短信的方法,其特征在于,所述根据所述待比较词汇和各所述待比较短信获取所述发送短信源号码的内容相似度包括:
根据所述待比较词汇和各所述待比较短信获取各所述待比较短信的短信相似度;
根据各所述短信相似度获取所述发送短信源号码的内容相似度。
4.根据权利要求3所述的识别垃圾短信的方法,其特征在于,所述根据所述待比较词汇和各所述待比较短信获取各所述待比较短信的短信相似度包括:
将N个待比较词汇分别与所述待比较短信Mi进行匹配,其中1≤i≤P,P为待比较短信的个数,N、P和i均为大于0的整数;
当S个待比较词汇匹配成功时,该待比较短信的短信相似度为Ri=S/N,其中S为大于或等于0的整数;
所述根据各所述短信相似度获取所述短信号码的内容相似度包括:
获取短信相似度总和R=∑Ri;
根据所述短信相似度总和获取所述短信号码的内容相似度为Q=R/P。
5.根据权利要求1~4中任一条所述的识别垃圾短信的方法,其特征在于,在获取发送短信源号码对应的待检测短信之前,还包括:
当缓存区的短信数量存满时或缓存时间大于预设时间时,获取缓存区中对应短信条数大于第二预设阈值的发送短信源号码,并执行获取发送短信源号码对应的待检测短信的操作。
6.根据权利要求5所述的识别垃圾短信的方法,其特征在于,在获取缓存中对应短信条数大于第二预设阈值的发送短信源号码之后,且在执行获取发送短信源号码对应的待检测短信的操作之前,还包括:
获取所述大于第二预设阈值的发送短信源号码对应的不同接收号码的个数,判断所述不同接收号码的个数与所述待检测短信的个数的比例是否大于第三预设阈值,当判断结果为是时,执行获取发送短信源号码对应的待检测短信的操作。
7.一种识别垃圾短信的装置,其特征在于,包括:
获取模块,用于获取发送短信源号码对应的多条待检测短信;
第一抽取模块,用于从所述待检测短信中选取一条作为基准检验短信,并将所述待检测短信中除去所述基准检验短信之外的各条短信作为待比较短信;
第二抽取模块,用于从所述基准检验短信中抽取待比较词汇;
获取内容相似度模块,用于根据所述待比较词汇和所述待比较短信,获取所述发送短信源号码的内容相似度;
第一判断模块,用于当所述内容相似度大于第一预设阈值时,将所述发送短信源号码对应的所有短信识别为垃圾短信。
8.根据权利要求7所述的识别垃圾短信的装置,其特征在于,所述第一判断模块包括:
比较子模块,用于当比较出所述内容相似度大于第一预设阈值时,触发所述识别垃圾词汇子模块,
识别垃圾词汇子模块,用于根据预设的垃圾词库判断所述待比较词汇中的垃圾词汇是否大于预设的垃圾词汇阈值,当判断结果为是时,触发识别子模块;
所述识别子模块,用于将所述发送短信源号码对应的所有短信识别为垃圾短信。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210320796.X/1.html,转载请声明来源钻瓜专利网。