[发明专利]一种APP流量自动识别模型构建方法有效
申请号: | 201810346473.5 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108650195B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 蒋言;李维;杨铃;张先勇;汪洋;彭艳兵;李华蓉 | 申请(专利权)人: | 南京烽火星空通信发展有限公司 |
主分类号: | H04L12/859 | 分类号: | H04L12/859;H04L12/851;G06F8/74;G06F8/75;G06K9/62;H04L29/12 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 杨海军 |
地址: | 210019 江苏省南京市建*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 app 流量 自动识别 模型 构建 方法 | ||
1.一种APP流量自动识别模型构建方法,其特征在于,所述方法的具体步骤包括:
步骤一、获取APP的应用程序包;
步骤二、由上述应用程序包获取APP的服务器IP地址;
所述步骤二具体包括:
由APP的应用程序包获取其APK文件;
采用ApkTool及AXMLPrinter2工具解析APK中的AndroidManifest.xml文件;
从AndroidManifes.xml文件中获取该APK对应的域名;
通过ipip.net解析域名对应服务器IP地址的IP池;
步骤三、由上述IP地址进行设定时间段内的流量精准筛选,获取APP流量自动识别模型建立所需的训练数据;
所述的流量精准筛选的方法具体包括:
采用monkey或monkeyRunner工具,进行APK文件的自启动运行;
采用tcpdump或wireshark工具,进行APK文件运行的自动抓包,生成pcap文件;
对pcap文件进行数据报文流数据重组;
解析pcap文件获取五元组信息;
根据APP对应的IP池和pcap解析出的五元组信息,完成流数据的聚类,得到每类APP的精准训练数据;
步骤四、由上述训练数据构建特征选取方法和学习过程;
步骤五、为每个APP构建一个对应的二分类器,对于未知类别的流量数据,经数据预处理之后放入二分类器,输出概率最高的APP类别,判断为未知流量的APP类别。
2.如权利要求1所述的一种APP流量自动识别模型构建方法,其特征在于,所述pcap文件的五元组信息包括:源IP,源端口号,目的IP,目的端口号,传输层协议。
3.如权利要求2所述的一种APP流量自动识别模型构建方法,其特征在于,步骤三所述的训练数据的获得方法具体包括:
根据源IP和目的IP的位置,按照数据流的传输方向,将数据流分为上行数据和下行数据;
剔除数据流MAC层、IP层、传输层数据,提取数据的有效净载荷;
根据协议采取相应的净载荷提取方式,对有效净载荷进行归一化处理;
将归一化之后的满足设定维数的据作为输入的训练数据。
4.如权利要求1所述的一种APP流量自动识别模型构建方法,其特征在于:所述步骤五中,采用XGBoost为每个APP的训练数据构建二分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京烽火星空通信发展有限公司,未经南京烽火星空通信发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810346473.5/1.html,转载请声明来源钻瓜专利网。