[发明专利]应用识别方法及装置有效
申请号: | 201511028801.X | 申请日: | 2015-12-31 |
公开(公告)号: | CN105591973B | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 李鹏 | 申请(专利权)人: | 杭州数梦工场科技有限公司 |
主分类号: | H04L12/851 | 分类号: | H04L12/851;H04L12/859 |
代理公司: | 11415 北京博思佳知识产权代理有限公司 | 代理人: | 林祥 |
地址: | 310024 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用 识别 方法 装置 | ||
本申请提供一种应用识别方法及装置,所述方法包括:读取预设的数据样本库中的数据分析样本;所述数据分析样本包括报文的应用类型以及该报文的报文特征;针对读取到的预设数量的数据分析样本进行统计分析以得到应用识别规则;所述应用识别规则包括报文特征与应用类型之间的映射关系;基于所述应用识别规则识别目标报文的应用类型。本申请可以降低CPU的资源消耗,提供处理节点的吞吐量,提高报文的应用识别效率。
技术领域
本申请涉及通信领域,尤其涉及一种应用识别方法及装置。
背景技术
在互联网上,政府部门或者各运营商基于运营和安全管控的目的,通常需要识别互联网上的报文所属的应用类型,并做出相应的管控。例如,互联网上存在大量私有协议应用,比如微博,微信等,这些应用是非标准化的,因此出于运营和安全管控的目的,通常需要识别用户使用这类应用发出的报文所属的应用类型,然后针对特定的应用的流量做限速、阻断、审计、分流(路由)等业务处理。
发明内容
本申请提出一种应用识别方法,该方法包括:
读取预设的数据样本库中的数据分析样本;所述数据分析样本包括报文的应用类型以及该报文的报文特征;
针对读取到的预设数量的数据分析样本进行统计分析以得到应用识别规则;所述应用识别规则包括报文特征与应用类型之间的映射关系;
基于所述应用识别规则识别目标报文的应用类型。
可选的,所述读取数据样本库中的数据分析样本之前,所述方法还包括:
基于报文内容识别接收到的报文的应用类型;
当识别出接收到的报文的应用类型后,将识别出的该报文的应用类型,以及该报文的报文特征作为数据分析样本保存至所述数据样本库。
可选的,所述针对读取到的预设数量的数据分析样本进行统计分析以得到应用识别规则包括:
将所述数据样本库中报文特征相同的数据分析样本进行分组;
统计分组后的每一个分组的会话数;
当任一分组对应唯一相同的应用类型,并且该分组的会话数达到第一预设阈值,则基于该分组中的报文特征和该分组中的应用类型建立所述映射关系,以得到所述应用识别规则。
可选的,其特征在于,所述方法还包括:
当任一分组对应多种应用类型时,分别计算该多种应用类型在该分组中的会话占比,以及该多种应用类型在该分组中对应的会话数;
提取该多种应用类型中对应的会话数达到所述第一预设阈值,并且会话占比达到第二预设阈值的应用类型;
基于该分组中的报文特征和提取出的所述应用类型建立所述映射关系。
可选的,所述基于所述应用识别规则识别目标报文的应用类型包括:
提取目标报文的报文特征;
将提取出的所述目标报文的报文特征在所述应用识别规则中进行匹配;
当在所述应用识别规则中匹配到所述目标报文的报文特征时,基于所述映射关系查询与所述目标报文的报文特征对应的应用类型。
可选的,所述方法还包括:
当查询到与所述目标报文的报文特征对应的应用类型后,从所述目标报文中提取校验样本;
基于查询到的所述应用类型对提取出的所述校验样本进行校验;
当校验成功后,基于查询到的所述应用类型对所述目标报文对应的会话进行标记。
可选的,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州数梦工场科技有限公司,未经杭州数梦工场科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511028801.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种碎报处理方法及装置
- 下一篇:邻居的识别方法及装置