[发明专利]短信内容快速匹配方法及基于内容的短信拦截方法有效
申请号: | 202011523655.9 | 申请日: | 2020-12-22 |
公开(公告)号: | CN112261600B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 陈世虎;田凯 | 申请(专利权)人: | 江苏音信通信息技术有限公司 |
主分类号: | H04W4/14 | 分类号: | H04W4/14;H04W12/128;G06F16/33;G06F16/31 |
代理公司: | 南京苏创专利代理事务所(普通合伙) 32273 | 代理人: | 张艳 |
地址: | 210000 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 短信 内容 快速 匹配 方法 基于 拦截 | ||
本发明涉及一种短信内容快速匹配方法及基于内容的短信拦截方法,属于智能数据的技术领域。短信内容快速匹配方法为计算待发送短信内容长度,选择数据库中同长度的短信内容进行匹配,大幅缩小短信匹配的范围。选取待发送短信和数据库中的短信的特征码进行匹配,经过优化化的短信特征码相当于原短信长度的20%左右,节约80%的行业短信匹配时间。以字符串长度值这索引,建立行业短信内容匹配库。行业短信内容匹配库建立自动删除机制,抑制行业短信匹配库无限制鼓胀。短信拦截方法包括允许发送量和发送率,超出的短信经过短信内容匹配,判定为同一内容短信大量发送,则拦截。本发明,实现短信净化,避免垃圾短信大量转发,造成恶劣影响。
技术领域
本发明涉及一种短信内容快速匹配方法及基于内容的短信拦截方法,属于智能数据的技术领域。
背景技术
为了防止相同内容的短信被大范围发送,提出了在短信发送端,检测短信内容的想法,目前常用的办法是进行短信内容比较,在不进行任何算法优化情况下,进行行业短信发送完全匹配并计数,会出现以下两种情况:
1) 每发送一条不同内容的短信,匹配表增加一条记录,因此字符串匹配表将急速增长。单条短信最大容量为144个字符,一个中文汉字为2个字符,以一条短信平均50个汉字计算,则一条短信匹配内容为100个字节。以平均10万条短信匹配量计算,则匹配库仅字符串需占用 100*10*10000 =10000000字节,相当于10M字节开销,影响系统存储空间。
2) 需进行完全匹配的内容急速增加,系统性能消耗也将呈指数级增长,严重影响短信发送的及时性,甚至引发系统崩溃。
可见,针对行业的需要,以及现状的窘迫,亟待寻求到一种能够占用极少内存,高效快捷地检测短信内容的方法。
发明内容
为了解决上述技术问题,本发明提供一种短信内容快速匹配方法及基于内容的短信拦截方法,其具体技术方案如下:
短信内容快速匹配方法,包括以下步骤:
步骤1:短信数据库:以每次发送短信的内容为单元,建立短信数据库,
步骤2:长度匹配:计算待发送短信内容长度,选择短信数据库中同长度的短信,
步骤3:短信特征码匹配:从待发送短信内容中指定位置选取字符串,顺序组合成特征码,从步骤2选中的短信内容中,与待发送短信内容相同的位置提取字符串,顺序组合成特征码,比较待发送短信的特征码与步骤2选中短信的特征码是否一致,若是,则判定待发送短信存在于短信数据库中,待发送短信不增加到短信数据库,若不一致,则判定待发送短信不存在于短信数据库中,且将该待发送的短信存储于数据库中。
短信内容快速匹配方法,包括以下步骤:
步骤(1):短信数据库:以每次发送短信的内容为单元,建立短信数据库,
步骤(2):短信特征码库:提取步骤(1)中的短信数据库中的各个短信的特征码,形成特征码集;
步骤(3):提取待发送的短信的特征码;
步骤(4):将待发送短信的特征码与步骤(2)得到的特征码集首先进行长度检索,如特征码集中不存在长度一致的特征码,则判定为待发送短信不存在于短信数据库中,否则进入步骤(5);
步骤(5):将待发送短信的特征码和与其长度一致的特征码集中的特征码比对,若存在相同的特征码,则判定待发送短信存在于短信数据库中,若不存在,则判定待发送短信不存在于短信数据库中,且将待发送短信的特征码添加到特征码集中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏音信通信息技术有限公司,未经江苏音信通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011523655.9/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法