[发明专利]网络数据应用的特征提取方法及装置有效
申请号: | 201710538802.1 | 申请日: | 2017-07-04 |
公开(公告)号: | CN107302474B | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 张磊;刘静菠;陈航;刘嘉勇;程芃森;刘亮;黄勇 | 申请(专利权)人: | 四川无声信息技术有限公司;四川大学 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L29/06;H04L29/08 |
代理公司: | 11371 北京超凡志成知识产权代理事务所(普通合伙) | 代理人: | 王术兰 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 数据 应用 特征 提取 方法 装置 | ||
1.一种网络数据应用的特征提取方法,其特征在于,所述方法包括:
从网络应用层的特征候选集中读取待测网络数据应用对应的准特征值;
基于读取的准特征值对所述待测网络数据应用进行识别,根据识别结果从所述特征候选集中提取与所述待测网络数据应用对应的应用特征;
其中,所述基于读取的准特征值对所述待测网络数据应用进行识别,根据识别结果从所述特征候选集中提取与所述待测网络数据应用对应的应用特征的步骤包括:
根据准特征值对待测网络数据应用进行识别,得到一识别率;
在所述识别率小于预设识别率阈值时,通过调整设定的最小支持度及设定的最小通用度使所述识别率大于所述预设识别率阈值,以得到应用特征;
其中,所述在所述识别率小于预设识别率阈值时,通过调整设定的最小支持度及设定的最小通用度使所述识别率大于所述预设识别率阈值,以得到应用特征的步骤包括:
保持设定的最小通用度不变,将设定的最小支持度调整到下一个阶度;
根据调整后的最小支持度将所述准特征值中冗余的特征值进行滤出以更新准特征值,在更新后的准特征值对应的识别率大于所述预设识别率阈值时,停止调整最小支持度,同时输出更新后的准特征值对应的应用特征。
2.根据权利要求1所述的方法,其特征在于,所述基于读取的准特征值对所述待测网络数据应用进行识别,根据识别结果从所述特征候选集中提取与所述待测网络数据应用对应的应用特征的步骤还包括:
在所述识别率大于预设识别率阈值时,将所述准特征值对应的应用特征输出。
3.根据权利要求1所述的方法,其特征在于,所述在所述识别率小于所述预设识别率阈值时,通过调整设定的最小支持度及设定的最小通用度使所述识别率大于所述预设识别率阈值,以得到应用特征的步骤还包括:
在将设定的最小支持度调整到最低阶度,且所述识别率仍然小于所述预设识别率阈值时,将设定的最小通用度调整到下一个阶度;
根据调整后的最小通用度将所述更新后的准特征值中冗余的特征值进行滤出以再次更新准特征值,在再次更新后的准特征值对应的识别率大于所述预设识别率阈值时,停止调整最小通用度,同时输出再次更新后的准特征值对应的应用特征。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从所述网络应用层获得特征候选集;
所述从所述网络应用层获得特征候选集的步骤包括:
设定最小支持度,并根据设定的最小支持度由网络应用层的会话数据获得频繁项集;
通过对所述频繁项集进行过滤得到特征候选集。
5.根据权利要求4所述的方法,其特征在于,所述设定最小支持度,并根据设定的最小支持度由网络应用层的会话数据获得频繁项集的步骤包括:
扫描会话数据,获得支持度大于设定的最小支持度的字符长度为1的频繁项子集;
从上一字符长度的频繁项子集中获取字符长度加1的频繁项子集,直到不能根据已获得的频繁项子集获得字符长度更长的频繁项子集为止,以获得字符长度最长的频繁项子集;
由支持度大于设定的最小支持度的字符长度从1到字符长度最长对应的频繁项子集得到频繁项集。
6.根据权利要求4所述的方法,其特征在于,所述通过对所述频繁项集进行过滤得到特征候选集的步骤包括:
按照过滤策略将所述频繁项集中的冗余项进行滤除以得到特征候选集。
7.根据权利要求6所述的方法,其特征在于,所述过滤策略包括以下的任意一种或者之间的任意组合:
在所述频繁项集中同时包括子串及原串,且子串与原串出现的次数相同时,将所述子串滤除;或
计算频繁项在频繁项集中的位置固定度,将所述位置固定度小于预设位置固定度对应的频繁项滤除;或
将所述频繁项集中与待测网络数据应用无关的频繁项滤除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川无声信息技术有限公司;四川大学,未经四川无声信息技术有限公司;四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710538802.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置