[发明专利]一种数据处理方法、装置、服务器及存储介质在审
申请号: | 201910392683.2 | 申请日: | 2019-05-13 |
公开(公告)号: | CN110084653A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 刘鑫鑫 | 申请(专利权)人: | 北京小度信息科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N20/20 |
代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 汤陈龙;李丽 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商户 训练数据 数据处理 存储介质 服务器 机器学习模型 订单数据 画像数据 训练机器 字段数据 预设 预测 学习 | ||
本发明实施例提供一种数据处理方法、装置、服务器及存储介质,其中数据处理方法包括:获取商户在各种时段对应的训练数据,其中,商户在一种时段对应的训练数据至少包括商户在该种时段对应的订单数据,以及商户的商户画像数据中的预设字段数据;根据商户在各种时段对应的训练数据,训练机器学习模型;根据训练的机器学习模型预测商户在各种时段对应的商户等级。本发明实施例可实现准确的确定商户在各种时段的商户等级。
技术领域
本发明实施例涉及数据处理技术领域,具体涉及一种数据处理方法、装置、服务器及存储介质。
背景技术
商户等级是评价商户的重要信息,其在商户推荐排序等场景下具有重要应用,因此准确的确定商户等级具有重要意义。
商户在不同时段的订单量可能不同,若使用相同的商户等级作为商户在不同时段的商户等级可能并不准确,也就是说,同一商户在不同时段的商户等级可能不同;因此,如何改进数据处理方式,以准确的确定商户在各种时段的商户等级,成为了本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明实施例提供一种数据处理方法、装置、服务器及存储介质,以准确的确定商户在各种时段的商户等级。
为实现上述目的,本发明实施例提供如下技术方案:
第一方面,本发明实施例提供一种数据处理方法,包括:
获取商户在各种时段对应的训练数据;其中,商户在一种时段对应的训练数据至少包括商户在该种时段对应的订单数据,以及商户的商户画像数据中的预设字段数据;
根据商户在各种时段对应的训练数据,训练机器学习模型;
根据训练的机器学习模型预测商户在各种时段对应的商户等级。
第二方面,根据上述第一方面所述的数据处理方法,所述数据处理方法还包括:
标注商户在各种时段对应的商户等级标签;
所述根据商户在各种时段对应的训练数据,训练机器学习模型包括:
根据商户在各种时段对应的训练数据,训练机器学习模型,以使机器学习模型输出的商户在各种时段对应的商户等级,趋于标注的商户在各种时段对应的商户等级标签。
第三方面,根据上述第二方面所述的数据处理方法,所述根据商户在各种时段对应的训练数据,训练机器学习模型,以使机器学习模型输出的商户在各种时段对应的商户等级,趋于标注的商户在各种时段对应的商户等级标签包括:
以商户在各种时段对应的训练数据为训练样本,以机器学习模型的输出结果趋于商户在各种时段对应的商户等级标签为目标,迭代调整机器学习模型的参数,直至机器学习模型达到收敛条件。
第四方面,根据上述第一方面所述的数据处理方法,所述获取商户在各种时段对应的训练数据包括:
获取商户在各时段对应的原始训练数据;所述商户在各时段对应的原始训练数据至少包括商户在各种时段对应的原始订单数据,以及从商户的商户画像数据中提取的原始预设字段数据;
对商户在各时段对应的原始训练数据进行预处理,得到商户在各种时段对应的训练数据。
第五方面,根据上述第四方面所述的数据处理方法,所述对商户在各时段对应的原始训练数据进行预处理包括如下至少一项处理过程:
过滤噪音数据,以从商户在各种时段对应的原始训练数据中,去除异常数据;
进行数据归一化处理,以将商户在各种时段对应的原始训练数据的内容映射为0至1的值;
进行缺失值处理,以对商户在各种时段对应的原始训练数据中的空数据填充数据值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小度信息科技有限公司,未经北京小度信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910392683.2/2.html,转载请声明来源钻瓜专利网。