[发明专利]一种网络流量数据提取方法及装置有效
申请号: | 201911281052.X | 申请日: | 2019-12-13 |
公开(公告)号: | CN111092880B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 蒋学垲 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L69/08;H04L69/22 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络流量 数据 提取 方法 装置 | ||
公开了一种网络流量数据提取方法及装置。一种网络流量数据提取方法,其特征在于,该方法包括:获取至少一条网络流量;针对所述获取的任一条网络流量,确定该条网络流量的传输格式,选择与该传输格式对应的结构化解析器将该条网络流量解析为至少一条结构化数据记录;所述结构化数据记录中包含固定数量的数据项;根据解析结果,确定数据记录中至少一个数据项内容所对应的业务含义;根据预设的筛选规则,将与筛选规则相匹配的数据项内容与该数据项对应的网络流量标识进行关联存储。通过本说明书实施例所提供的方案,能够准确地从网络流量中提取出符合条件的数据,如隐私数据,再结合安全多方计算技术,能够高效地分析数据输出行为。
技术领域
本说明书实施例涉及信息安全技术领域,尤其涉及一种网络流量数据提取方法及装置。
背景技术
保护用户数据是企业重要的责任,为了更好地保护用户数据,企业通常会解析网络流量获取其中包含的数据,以此监控、分析数据输出行为。
但是网络流量所包含的数据往往并非标准的结构化的数据,难以直接从中获取可用于分析的有价值的数据。目前虽然可以单纯地通过正则表示式引擎来解析网络流量,但这种方式能解析的网络流量类型较少、解析准确性较低而且无法解析脱敏后的数据,所以通过这种方式得到的解析结果无法作为分析数据输出行为的可靠依据。
发明内容
针对上述技术问题,本说明书实施例提供一种网络流量数据提取方法及装置,技术方案如下:
根据本说明书实施例的第一方面,提供一种网络流量数据提取方法,该方法包括:
获取至少一条网络流量;
针对上述获取的任一条网络流量,确定该条网络流量的传输格式,选择与该传输格式对应的结构化解析器将该条网络流量解析为至少一条结构化数据记录;上述结构化数据记录中包含固定数量的数据项;
根据解析结果,确定数据记录中至少一个数据项内容所对应的业务含义;
根据预设的筛选规则,将与筛选规则相匹配的数据项内容与该数据项对应的网络流量标识进行关联存储。
根据本说明书实施例的第二方面,提供一种网络流量数据提取装置,该装置包括:
获取模块,用于获取至少一条网络流量;
解析模块,用于针对上述获取的任一条网络流量,确定该条网络流量的传输格式,选择与该传输格式对应的结构化解析器将该条网络流量解析为至少一条结构化数据记录;上述结构化数据记录中包含固定数量的数据项;
含义确定模块,用于根据解析结果,确定数据记录中至少一个数据项内容所对应的业务含义;
存储模块,用于根据预设的筛选规则,将与筛选规则相匹配的数据项内容与该数据项对应的网络流量标识进行关联存储。
本说明书实施例所提供的技术方案根据网络流量的传输格式选择结构化解析器来将其解析为结构化数据记录,并确定出得到的数据记录中的数据项内容的业务含义,然后筛选出符合条件的数据项内容,将其与网络流量的唯一标识关联存储,由此能够准确提取出网络流量中符合条件的数据,在此基础上还可结合安全多方计算技术,从而高效地分析数据输出行为,更好地保护用户的个人信息。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书实施例。
此外,本说明书实施例中的任一实施例并不需要达到上述的全部效果。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911281052.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置