[发明专利]一种流量包匹配方法及装置在审
申请号: | 201910218772.5 | 申请日: | 2019-03-21 |
公开(公告)号: | CN109903142A | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 崔羽飞;赵慧;王晓霞 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q10/04;G06Q50/30;G06K9/62;H04L12/851;H04L12/927 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 彭瑞欣;刘悦晗 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 流量包 用户数据 匹配 样本数据 最优模型 用户历史数据 数据仓库 通话费用 消费习惯 用户订购 原始数据 运营商 被叫 订购 筛选 客户 收入 | ||
1.一种流量包匹配方法,其特征在于,包括:
从数据仓库中获取原始用户数据;
从所述原始数据中筛选得到用户数据,所述用户数据包括话费数据、流量使用数据、语音数据和流量包订购信息;
对所述用户数据进行特征工程,得到样本数据;
根据所述样本数据和至少一个最优模型,确定与所述用户数据匹配的流量包。
2.如权利要求1所述的方法,其特征在于,所述最优模型为多个;所述根据所述样本数据和至少一个最优模型,确定与所述用户数据匹配的流量包,包括:
将所述样本数据分别输入各个最优模型中,得到各个最优模型的输出结果,所述输出结果为流量包;
根据所述各个最优模型的输出结果和预设的权重,确定与所述用户数据匹配的流量包;或者,从所述各个最优模型的输出结果中,确定相同的输出结果的数量,选择出数量最大的输出结果作为与所述用户数据匹配的流量包。
3.如权利要求1或2所述的方法,其特征在于,所述最优模型的训练步骤包括:
获取历史用户数据,并对所述历史用户数据进行特征工程,得到历史样本数据;
按照预设比例,将所述历史样本数据分割为训练数据和验证数据;
将所述训练数据分为N组,并根据N组训练数据分别训练预设的N个模型,N为大于2的整数;
根据所述验证数据分别计算所述N个模型的评价参数,并根据所述评价参数确定至少一个最优模型。
4.如权利要求3所述的方法,其特征在于,获取历史用户数据之后、对所述历史用户数据进行特征工程,得到历史样本数据之前,还包括数据预处理步骤,所述数据预处理步骤包括:
将所述历史用户数据的类型转换为数字类型;
对所述转换后的历史用户数据进行数据探索;
对完成数据探索的历史用户数据进行数据属性规约。
5.如权利要求4所述的方法,其特征在于,对完成数据探索的历史用户数据进行数据属性规约之后,所述预处理步骤还包括:
对完成数据属性规约的历史用户数据进行归一化处理。
6.如权利要求3所述的方法,其特征在于,所述获取历史用户数据之前,还包括数据准备步骤,所述数据准备步骤包括:从数据仓库中获取原始的历史用户数据,从所述原始的历史数据中筛选得到历史用户数据,并将所述历史用户数据存储至所述数据仓库内;
所述获取历史用户数据具体包括:从所述数据仓库中获取历史用户数据。
7.如权利要求3所述的方法,其特征在于,N等于4,预设的4个模型包括:逻辑回归模型、决策树模型、随机森林模型和Xgboost模型。
8.一种服务器,其特征在于,包括:获取模块、筛选模块、特征工程模块和匹配模块,
所述获取模块用于,从数据仓库中获取原始用户数据;
所述筛选模块用于,从所述原始数据中筛选得到用户数据,所述用户数据包括话费数据、流量使用数据、语音数据和流量包订购信息;
所述特征工程模块用于,对所述用户数据进行特征工程,得到样本数据;
所述匹配模块用于,根据所述样本数据和至少一个最优模型,确定与所述用户数据匹配的流量包。
9.如权利要求8所述的服务器,其特征在于,所述最优模型为多个;所述匹配模块具体用于,将所述样本数据分别输入各个最优模型中,得到各个最优模型的输出结果,所述输出结果为流量包;根据所述各个最优模型的输出结果和预设的权重,确定与所述用户数据匹配的流量包;或者,从所述各个最优模型的输出结果中,确定相同的输出结果的数量,选择出数量最大的输出结果作为与所述用户数据匹配的流量包。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910218772.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:VR虚拟现实客户端
- 下一篇:一种基于用户消费水平的航班推荐方法