[发明专利]数据处理方法、装置、设备及计算机可读存储介质有效
申请号: | 201810752308.X | 申请日: | 2018-07-10 |
公开(公告)号: | CN109088788B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 袁晓静;翟京卿 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;G06F21/31 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 柴海平;刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明提供一种数据处理方法、装置、设备及计算机可读存储介质。本发明的方法,通过从待处理的第一用户数据和第二用户数据中分别提取第一用户和第二用户的第一身份特征数据,第一身份特征数据包括至少一种用于唯一标识一个用户主体的身份信息;根据第一用户和第二用户的第一身份特征数据,确定第一用户和第二用户是否属于同一用户主体;若确定第一用户和第二用户属于同一用户主体,则对第一用户数据和第二用户数据进行合并处理,实现了将同一用户主体的多个用户数据合并处理形成全景式用户特征数据,减少了DPI系统整体的数据冗余。
技术领域
本发明涉及信息数据处理技术领域,尤其涉及一种数据处理方法、装置、设备及计算机可读存储介质。
背景技术
深度报文检测(Deep Packet Inspection,简称DPI)是一种基于数据报文的应用层流量检测和控制技术,针对数据报文的不同层信息进行深度检测和分析,从而得到整个数据流或数据包的应用层信息,然后按照DPI系统定义的策略对流量进行统计分析和控制。
随着大数据和互联网技术的发展,各种应用进入人们的生活。由于不同的应用对于用户的注册信息不具有统一的要求,同一用户注册不同应用使用的用户标识可能不同,不同用户注册不同应用可能会使用相同的用户标识。目前DPI系统在获取用户的行为数据时,针对每种应用建立每个用户对应的用户行为数据,存储大量的冗余数据,且无法形成全景式用户特征数据。
发明内容
本发明提供一种数据处理方法、装置、设备及计算机可读存储介质,用以解决目前DPI系统在获取用户的行为特征数据时,针对每种应用建立每个用户对应的用户行为特征数据,存储大量的冗余数据,且无法形成全景式用户特征数据的问题。
本发明的一个方面是提供一种数据处理方法,包括:
从待处理的第一用户数据和第二用户数据中分别提取第一用户和第二用户的第一身份特征数据,所述第一身份特征数据包括至少一种用于唯一标识一个用户主体的身份信息;
根据所述第一用户和第二用户的第一身份特征数据,确定所述第一用户和第二用户是否属于同一用户主体;
若确定所述第一用户和第二用户属于同一用户主体,则对所述第一用户数据和第二用户数据进行合并处理。
本发明的另一个方面是提供一种数据处理装置,包括:
数据提取模块,用于从待处理的第一用户数据和第二用户数据中分别提取第一用户和第二用户的第一身份特征数据,所述第一身份特征数据包括至少一种用于唯一标识一个用户主体的身份信息;
确定模块,用于根据所述第一用户和第二用户的第一身份特征数据,确定所述第一用户和第二用户是否属于同一用户主体;
处理模块,用于若确定所述第一用户和第二用户属于同一用户主体,则对所述第一用户数据和第二用户数据进行合并处理
本发明的另一个方面是提供一种深度报文检测设备,包括:
存储器,处理器,以及存储在所述存储器上并可在所述处理器上运行的计算机程序,
所述处理器运行所述计算机程序时实现上述所述的方法。
本发明的另一个方面是提供一种计算机可读存储介质,存储有计算机程序,
所述计算机程序被处理器执行时实现上述所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810752308.X/2.html,转载请声明来源钻瓜专利网。