[发明专利]一种用户行为识别方法、系统、设备及存储介质有效
申请号: | 202111056222.1 | 申请日: | 2021-09-09 |
公开(公告)号: | CN113904961B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 谢逸 | 申请(专利权)人: | 中山大学 |
主分类号: | H04L43/0876 | 分类号: | H04L43/0876;H04L41/14;G06N3/08;G06N3/04 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 许羽冬;郭浩辉 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 行为 识别 方法 系统 设备 存储 介质 | ||
本发明涉及网络用户行为识别技术领域,尤其涉及一种用户行为识别方法、系统、设备及存储介质,包括:对所述IP数据流进行预处理,得到相应的编码向量和属性特征;根据所述编码向量以及预先构建的超图表达模型,将预设时间窗口内的IP数据流及其属性特征转换为多图层超图;基于所述多图层超图,根据连续时间窗口中的IP数据流,得到与时间窗口相应的超图序列;对所述超图序列进行实时行为标注,得到用户行为标注序列。本发明提供的方法,不仅能够使网络管理员在无需解密以及获取高层信息的情况下,通过网络数据流即可识别用户行为,同时描述了用户持续的访问行为规律,有效地提升了互联网的安全性,且适用范围广。
技术领域
本发明涉及网络用户行为识别技术领域,尤其涉及一种面向网络链路的用户行为识别方法、系统、设备及存储介质。
背景技术
网络链路是数据通信中的关键环节,是连接源和目的的管道,网络链路承担数据业务的传输任务,为保障网络链路的正常和稳定,许多不同的技术被应用于网络链路管理,包括:负载均衡、流量工程、安全检测等。
网络链路位于TCP/IP协议栈的中下层,上层信息对其不可见,已有的链路管理技术也主要从流量负载的角度实现链路管理,随着网络规模的急剧增长及异构化、网络服务的快速发展与渗透,面向“流量”的传统网络链路管理方式已经不能满足新的需求,基于用户行为规律、偏好、习惯的定制化网络链路管理成为新的发展方向,但是,由于网络链路在协议栈中所处的位置,使其无法直接获取位于高层的用户行为信息,而且日益普及的数据流加密技术也进一步增加了用户行为解析的难度,因此,突破面向网络链路的用户行为识别是目前亟待解决的重要问题之一。
发明内容
本发明的目的是提供一种用户行为识别方法、系统、设备及存储介质,使得网络管理员无需获取高层信息,仅通过网络数据流即可识别用户行为。
为解决以上技术问题,本发明提供了一种用户行为识别方法、系统、设备及存储介质。
第一方面,本发明提供了一种用户行为识别方法,所述方法包括以下步骤:
采集网络链路上的实时流量数据,得到实时IP数据流;
对所述IP数据流进行预处理,得到相应的编码向量和属性特征;
根据所述编码向量以及预先构建的超图表达模型,将预设时间窗口内的IP 数据流及其属性特征转换为多图层超图;
基于所述多图层超图,根据连续时间窗口中的IP数据流,得到与时间窗口相应的超图序列;
对所述超图序列进行实时行为标注,得到用户行为标注序列,以确定用户行为类型。
在进一步的实施方案中,所述对所述IP数据流进行预处理,得到相应的编码向量和属性特征的步骤包括:
在训练阶段,采集网络链路上用于训练的流量数据,得到IP数据流训练样本,并对所述IP数据流训练样本与预设的用户行为标注进行拼接、编码,得到编码表;
根据训练得到的编码表,获取所述IP数据流中每一个IP地址的编码向量;
对得到的所有所述编码向量以用户为单元进行流量分离,得到用户数据流;
利用预设时间窗口对所述用户数据流进行窗口分割,得到窗口流片段;
对每个所述窗口流片段进行特征提取,得到属性特征。
在进一步的实施方案中,根据所述编码向量以及预先构建的超图表达模型,将预设时间窗口内的IP数据流及其属性特征转换为多图层超图的步骤包括:
在网络链路上采集用于模型训练的流量数据,得到IP数据流训练样本;
根据所述IP数据流训练样本以及预设的用户行为标注训练神经网络模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111056222.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种富氢水电解灌装装置
- 下一篇:双目立体电动旋转电切镜