[发明专利]一种数据处理方法及装置在审
申请号: | 201810525255.8 | 申请日: | 2018-05-28 |
公开(公告)号: | CN108984588A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 李首峰;李莉莉;孙立宏;陈放 | 申请(专利权)人: | 国政通科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/62;G06K9/62 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 100195 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户分组 分组特征 增值业务 增值业务系统 特征数据 脱敏处理 用户标识 聚类处理 数据处理 记录 提取信息 用户分群 用户提供 用户隐私 增值服务 分群 聚类 算法 分组 | ||
本文公开了一种数据处理方法,包括:获取各用户的增值业务记录并进行脱敏处理;从所述脱敏处理后的增值业务记录中提取信息,形成用于聚类处理的特征数据集;利用k–Means算法对所述特征数据集进行聚类处理,得到用户分组;根据各用户分组下特征数据集,确定用户分组的分组特征;至少将所述用户分组的用户标识及其分组特征提供给增值业务系统。通过脱敏处理、k–Means聚类实现基于增值业务的用户分群/分组,能够在保护用户隐私的前提下基于各用户的增值业务记录对用户进行分群;将用户分组的用户标识及其分组特征提供给增值业务系统,便于增值业务系统通过分组特征和用户标识有针对性的为相应用户提供增值服务。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数据处理方法及装置。
背景技术
随着移动网络和互联网的广泛应用,各类增值业务层出不穷。对于用户网络行为数据的分析大多集中于用户上网行为的分析、上网套餐、流量等信息的挖掘。而对于用户分群来说,大多是基于用户流量、网页类别的用户分群,对于增值业务相关的用户分群,目前尚未提出有效的解决方案。
发明内容
本申请旨在至少解决上述技术问题之一。
本申请提供一种基于增值业务的数据处理方法及装置,能够在去隐私化的基础上基于不同增值业务对用户进行分群,以便有针对性的提供增值服务。
基于上述目的,在本申请的一个方面,提出了
一种数据处理方法,其特征在于,包括:
获取各用户的增值业务记录并进行脱敏处理;
从所述脱敏处理后的增值业务记录中提取信息,形成用于聚类处理的特征数据集,所述特征数据集至少包括用户标识、增值业务使用频率、增值业务使用时长、增值业务使用类型数;
利用k–Means算法对所述特征数据集进行聚类处理,得到用户分组;
根据各用户分组下增值业务使用频率、增值业务使用时长、增值业务使用类型数的均值,确定用户分组的分组特征;
至少将所述用户分组的用户标识及其分组特征提供给增值业务系统。
优选地,所述方法还包括:分别对所述特征数据集中的增值业务使用频率、增值业务使用时长、增值业务使用类型数进行标准化处理;
所述利用k–Means算法对所述特征数据集进行聚类处理,得到用户分组,包括:将所述标准化处理后的特征数据集输入预先构建的K-Means模型,初始化所述K-Means模型的迭代参数,并设置所述K-Means模型的簇数为预设的用户分组总数;运行所述K-Means模型以对所述特征数据集执行聚类处理,最终得到所述用户分组的结果并输出。
优选地,所述根据各用户分组下增值业务使用频率、增值业务使用时长、增值业务使用类型数的均值,确定用户分组的分组特征,包括:
分别计算各用户分组下增值业务使用频率、增值业务使用时长、增值业务使用类型数的均值,根据所述增值业务使用频率、增值业务使用时长、增值业务使用类型数的均值大小确定各用户分组的分组特征。
优选地,所述方法还包括:提取各用户分组下的用户标识,分别形成相应的分组数据集,并按照相应用户分组的分组特征对所述分组数据集进行标记;
所述至少将所述用户分组的用户标识及其分组特征提供给增值业务系统,包括:将各用户分组的所述分组数据集发送给增值业务系统。
优选地,所述脱敏处理,包括:
识别每条增值业务记录中的敏感信息;
从预先配置的脱敏规则表中查询对应所述敏感信息的脱敏规则,并按照所述脱敏规则对所述敏感信息执行脱敏操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国政通科技股份有限公司,未经国政通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810525255.8/2.html,转载请声明来源钻瓜专利网。