[发明专利]一种数据处理方法及装置在审
申请号: | 201810525255.8 | 申请日: | 2018-05-28 |
公开(公告)号: | CN108984588A | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 李首峰;李莉莉;孙立宏;陈放 | 申请(专利权)人: | 国政通科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/62;G06K9/62 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 100195 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户分组 分组特征 增值业务 增值业务系统 特征数据 脱敏处理 用户标识 聚类处理 数据处理 记录 提取信息 用户分群 用户提供 用户隐私 增值服务 分群 聚类 算法 分组 | ||
1.一种数据处理方法,其特征在于,包括:
获取各用户的增值业务记录并进行脱敏处理;
从所述脱敏处理后的增值业务记录中提取信息,形成用于聚类处理的特征数据集,所述特征数据集至少包括用户标识、增值业务使用频率、增值业务使用时长、增值业务使用类型数;
利用k–Means算法对所述特征数据集进行聚类处理,得到用户分组;
根据各用户分组下增值业务使用频率、增值业务使用时长、增值业务使用类型数的均值,确定用户分组的分组特征;
至少将所述用户分组的用户标识及其分组特征提供给增值业务系统。
2.根据权利要求1所述的数据处理方法,其特征在于,
所述方法还包括:分别对所述特征数据集中的增值业务使用频率、增值业务使用时长、增值业务使用类型数进行标准化处理;
所述利用k–Means算法对所述特征数据集进行聚类处理,得到用户分组,包括:将所述标准化处理后的特征数据集输入预先构建的K-Means模型,初始化所述K-Means模型的迭代参数,并设置所述K-Means模型的簇数为预设的用户分组总数;运行所述K-Means模型以对所述特征数据集执行聚类处理,最终得到所述用户分组的结果并输出。
3.根据权利要求1所述的数据处理方法,其特征在于,所述根据各用户分组下增值业务使用频率、增值业务使用时长、增值业务使用类型数的均值,确定用户分组的分组特征,包括:
分别计算各用户分组下增值业务使用频率、增值业务使用时长、增值业务使用类型数的均值,根据所述增值业务使用频率、增值业务使用时长、增值业务使用类型数的均值大小确定各用户分组的分组特征。
4.根据权利要求1所述的数据处理方法,其特征在于,
所述方法还包括:提取各用户分组下的用户标识,分别形成相应的分组数据集,并按照相应用户分组的分组特征对所述分组数据集进行标记;
所述至少将所述用户分组的用户标识及其分组特征提供给增值业务系统,包括:将各用户分组的所述分组数据集发送给增值业务系统。
5.根据权利要求1所述的数据处理方法,其特征在于,所述脱敏处理,包括:
识别每条增值业务记录中的敏感信息;
从预先配置的脱敏规则表中查询对应所述敏感信息的脱敏规则,并按照所述脱敏规则对所述敏感信息执行脱敏操作。
6.一种数据处理装置,其特征在于,包括:获取模块、脱敏模块、特征提取模块、聚类模块、确定模块以及提供模块;其中,
获取模块,用于获取各用户的增值业务记录;
脱敏模块,用于对所述增值业务记录进行脱敏处理并输出到特征提取模块;
特征提取模块,用于从所述脱敏处理后的增值业务记录中提取信息,形成用于聚类处理的特征数据集,所述特征数据集至少包括用户标识、增值业务使用频率、增值业务使用时长、增值业务使用类型数;
聚类模块,用于利用k–Means算法对所述特征数据集进行聚类处理,得到用户分组;
确定模块,用于根据各用户分组下增值业务使用频率、增值业务使用时长、增值业务使用类型数的均值,确定用户分组的分组特征;
提供模块,用于至少将所述用户分组的用户标识及其分组特征提供给增值业务系统。
7.根据权利要求6所述的数据处理装置,其特征在于,
还包括:标准化模块,用于分别对来自所述特征提取模块的所述特征数据集的增值业务使用频率、增值业务使用时长、增值业务使用类型数进行标准化处理,并将所述标准化处理后的特征数据集输入预先构建的K-Means模型;
所述聚类模块,具体用于预先构建的K-Means模型;以及,用于初始化所述K-Means模型的迭代参数,设置所述K-Means模型的簇数为预设的用户分组总数,运行所述K-Means模型以对所述特征数据集执行聚类处理,最终得到所述用户分组的结果并输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国政通科技股份有限公司,未经国政通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810525255.8/1.html,转载请声明来源钻瓜专利网。