[发明专利]用于平台在线模型的数据处理方法和装置有效
申请号: | 201811379058.6 | 申请日: | 2018-11-19 |
公开(公告)号: | CN109583729B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 赵乾坤;高利翠;陈露佳;金宏;王维强;赵闻彪 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06N20/00;G06Q20/40 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 张静娟;周良玉 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 平台 在线 模型 数据处理 方法 装置 | ||
1.一种用于平台在线模型的数据处理方法,其中,所述平台支持第一类用户与第二类用户之间的交互业务,所述方法包括:
获取所述模型第一预定时段内的多个输入数据和相应的多个输出数据;
基于所述平台的在所述第一预定时段内的交互数据,确定所述第一预定时段是否为异常时段;以及
在确定所述第一预定时段不是异常时段的情况中,获取与所述多个输入数据分别相应的标签值,以获取所述模型的多个训练样本,其中,每个训练样本包括输入数据、相应的输出数据和相应的标签值;
在确定所述第一预定时段是异常时段的情况中,删除所述第一预定时段内的多个输入数据和相应的多个输出数据。
2.根据权利要求1所述的方法,还包括,在获取所述多个训练样本之后,将所述多个训练样本放入训练样本池中。
3.根据权利要求2所述的方法,还包括
在将所述多个训练样本放入训练样本池之后,通过训练样本池中第二预定时段内的样本,确定所述模型的性能指标是否超出预定范围;以及
在所述性能指标超出预定范围的情况中,使用所述训练样本池中第三预定时段内的样本训练所述模型。
4.根据权利要求3所述的方法,其中,所述性能指标包括以下至少一种:准确率、召回率、AUC、KS值、PSI。
5.根据权利要求1所述的方法,其中,所述第一预定时段为过去一天。
6.根据权利要求5所述的方法,其中,获取与所述多个输入数据分别相应的标签值包括,在三天之后,获取与所述多个输入数据分别相应的标签值。
7.根据权利要求1所述的方法,其中,所述第一预定时段为过去的与当天间隔三天的一天。
8.根据权利要求1所述的方法,其中,所述模型输入数据和相应的模型输出数据通过所述模型的运行日志获取。
9.根据权利要求1所述的方法,其中,所述平台支持商户与消费者之间的交易业务,所述模型为交易风控模型,其中,所述模型输入数据为交易的特征数据,所述模型输出数据预测该交易是否存在风险,所述标签数据指示该交易是否存在风险,以及,所述交互数据为交易额。
10.根据权利要求9所述的方法,其中,所述第一预定时段具有第一预定时长,其中,基于所述平台的在所述第一预定时段内的交互数据,确定所述第一预定时段是否为异常时段包括,基于所述平台中多个选定商户在所述第一预定时段之前的第一预定数目个具有所述第一预定时长的时段中各个时段的交易额,确定所述第一预定时段内的交易额是否异常,以确定所述第一预定时段是否为异常时段。
11.根据权利要求10所述的方法,其中,基于所述各个时段的交易额,确定所述第一预定时段内的交易额是否异常包括,基于所述各个时段的交易额的均值和方差,确定所述第一预定时段内的交易额是否异常。
12.根据权利要求10所述的方法,其中,所述选定商户基于以下至少一项确定:
商户业务指标;
商户在过去一段时间中的正常期经营指标与异常期经营指标的差异性。
13.根据权利要求12所述的方法,其中,所述正常期和所述异常期各自包括至少一个具有第二预定时长的时段,所述经营指标包括每时段交易额的均值和/或方差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811379058.6/1.html,转载请声明来源钻瓜专利网。