[发明专利]一种未知应用层协议报文格式的最佳分段方法有效
申请号: | 201110439412.1 | 申请日: | 2011-12-23 |
公开(公告)号: | CN102523167A | 公开(公告)日: | 2012-06-27 |
发明(设计)人: | 余顺争 | 申请(专利权)人: | 中山大学 |
主分类号: | H04L12/56 | 分类号: | H04L12/56;H04L29/06;G06F17/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 邱奕才;禹小明 |
地址: | 510000 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种未知应用层协议报文格式的最佳分段方法,用于未知应用层协议反向工程。它利用未知应用层协议在网络会话过程中传输的报文序列样本集,通过隐半马尔可夫模型(HSMM)模型参数估计算法,从报文序列样本集中获取模型参数,再通过基于HSMM的最大似然概率分段方法,对报文中的各个字段进行最佳划分,同时获取代表各个字段语义的关键词、属性值、状态码或类型码。这种方法不需要关于未知应用层协议的先验知识,也不要求绝对纯净的样本集。它不仅能够有效解析报文格式,它还能够基于观测序列的似然概率分布,发现混杂在样本集中的其它协议数据(噪声)并进行有效过滤。 | ||
搜索关键词: | 一种 未知 应用 协议 报文 格式 最佳 分段 方法 | ||
【主权项】:
一种未知应用层协议报文格式的最佳分段方法,其特征在于利用未知应用层协议在网络会话过程中传输的报文序列样本集,通过隐半马尔可夫模型的模型参数估计算法,从报文序列样本集中获取模型参数,所述报文序列样本集中的每个报文序列被看作一个字符串,所述每个字符串称为一个观测序列,再基于隐半马尔可夫模型的最大似然概率分段方法,对报文进行最佳分段,同时获取代表各个字段语义的应用层协议关键词、属性值、状态码或类型码,并基于观测序列的似然概率分布,发现混杂在样本集中的噪声数据并进行有效过滤。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110439412.1/,转载请声明来源钻瓜专利网。