[发明专利]一种数据处理方法、装置、服务器及存储介质在审
申请号: | 201910392683.2 | 申请日: | 2019-05-13 |
公开(公告)号: | CN110084653A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 刘鑫鑫 | 申请(专利权)人: | 北京小度信息科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N20/20 |
代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 汤陈龙;李丽 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商户 训练数据 数据处理 存储介质 服务器 机器学习模型 订单数据 画像数据 训练机器 字段数据 预设 预测 学习 | ||
1.一种数据处理方法,其特征在于,包括:
获取商户在各种时段对应的训练数据;其中,商户在一种时段对应的训练数据至少包括商户在该种时段对应的订单数据,以及商户的商户画像数据中的预设字段数据;
根据商户在各种时段对应的训练数据,训练机器学习模型;
根据训练的机器学习模型预测商户在各种时段对应的商户等级。
2.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:
标注商户在各种时段对应的商户等级标签;
所述根据商户在各种时段对应的训练数据,训练机器学习模型包括:
根据商户在各种时段对应的训练数据,训练机器学习模型,以使机器学习模型输出的商户在各种时段对应的商户等级,趋于标注的商户在各种时段对应的商户等级标签。
3.根据权利要求1所述的数据处理方法,其特征在于,所述获取商户在各种时段对应的训练数据包括:
获取商户在各时段对应的原始训练数据;所述商户在各时段对应的原始训练数据至少包括商户在各种时段对应的原始订单数据,以及从商户的商户画像数据中提取的原始预设字段数据;
对商户在各时段对应的原始训练数据进行预处理,得到商户在各种时段对应的训练数据。
4.根据权利要求3所述的数据处理方法,其特征在于,所述对商户在各时段对应的原始训练数据进行预处理包括如下至少一项处理过程:
过滤噪音数据,以从商户在各种时段对应的原始训练数据中,去除异常数据;
进行数据归一化处理,以将商户在各种时段对应的原始训练数据的内容映射为0至1的值;
进行缺失值处理,以对商户在各种时段对应的原始训练数据中的空数据填充数据值。
5.根据权利要求1所述的数据处理方法,其特征在于,所述根据训练的机器学习模型预测商户在各种时段对应的商户等级包括:
获取商户在目标时段对应的预测数据;其中,商户在目标时段对应的预测数据至少包括商户在目标时段对应的订单数据,以及所述商户的商户画像数据中的预设字段数据;所述目标时段为任一种时段或者指定时段;
根据训练的机器学习模型,预测所述商户在目标时段对应的预测数据所对应的商户等级,得到商户在目标时段对应的商户等级。
6.根据权利要求1所述的数据处理方法,其特征在于,还包括:
在商户的商户画像数据中记录所预测的商户在各时段对应的商户等级。
7.根据权利要求1所述的数据处理方法,其特征在于,还包括:
确定待排序商户;
至少根据所述待排序商户在当前时段对应的商户等级,确定所述待排序商户在所述当前时段对应的推荐排序。
8.一种数据处理装置,其特征在于,包括:
训练数据获取模块,用于获取商户在各种时段对应的训练数据;其中,商户在一种时段对应的训练数据至少包括商户在该种时段对应的订单数据,以及商户的商户画像数据中的预设字段数据;
训练模块,用于根据商户在各种时段对应的训练数据,训练机器学习模型;
预测模块,用于根据训练的机器学习模型预测商户在各种时段对应的商户等级。
9.一种服务器,其特征在于,包括至少一个存储器和至少一个处理器;所述存储器存储程序,所述处理器调用所述程序,以执行权利要求1-7任一项所述的数据处理方法。
10.一种存储介质,其特征在于,所述存储介质存储有执行权利要求1-7任一项所述的数据处理方法的程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小度信息科技有限公司,未经北京小度信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910392683.2/1.html,转载请声明来源钻瓜专利网。