[发明专利]针对机器学习效果的测试方法、装置、设备和介质有效
申请号: | 202010322893.7 | 申请日: | 2020-04-22 |
公开(公告)号: | CN113537506B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 何晴;赵晓平;张文博 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 机器 学习 效果 测试 方法 装置 设备 介质 | ||
1.一种针对机器学习效果的测试方法,其特征在于,包括:
获取在线上系统中对获取的请求数据进行特征提取得到的线上特征集,以及利用机器学习模型对所述线上特征集进行预估得到的线上预估值集合;
获取在线下系统中对应用阶段得到的样本集进行特征提取得到的第一线下特征集,以及利用所述机器学习模型对所述第一线下特征集进行评估得到的第一线下评估值集合;
分别从所述请求数据与所述样本集中获取第一交集数据和第二交集数据,其中,所述第一交集数据和第二交集数据在至少一个数据维度上具有相同的数据;
分别比较所述第一交集数据和第二交集数据、所述第一交集数据的线上特征集和所述第二交集数据的第一线下特征集、所述第一交集数据的线上预估值集合和所述第二交集数据的第一线下评估值集合,并根据比较结果确定测试结果;
其中,所述根据比较结果确定测试结果,包括:
如果经过比较,所述第一交集数据和第二交集数据、所述第一交集数据的线上特征集和所述第二交集数据的第一线下特征集、所述第一交集数据的线上预估值集合和所述第二交集数据的第一线下评估值集合中,至少有一组存在不一致,则表示在所述线上系统和线下系统中存在机器学习模型使用效果不一致的问题,如果均一致,则表示不存在机器学习模型使用效果不一致的问题。
2.根据权利要求1所述的方法,其特征在于,所述根据比较结果确定测试结果,包括:
如果所述第一交集数据和所述第二交集数据相同,所述第一交集数据的线上特征集和所述第二交集数据的第一线下特征集相同,并且所述第一交集数据的线上预估值集合和所述第二交集数据的第一线下评估值集合不相同,则确定所述机器学习模型在评估阶段和预估阶段中存在预估逻辑不匹配问题。
3.根据权利要求1所述的方法,其特征在于,所述根据比较结果确定测试结果,包括:
如果所述第一交集数据和第二交集数据相同,所述第一交集数据的线上特征集和所述第二交集数据的第一线下特征集不相同,并且所述第一交集数据的线上预估值集合和所述第二交集数据的第一线下评估值集合不相同,则确定在所述线上系统和线下系统中,所述特征抽取逻辑存在不一致。
4.根据权利要求1所述的方法,其特征在于,所述根据比较结果确定测试结果,包括:
如果所述第一交集数据和第二交集数据不相同,所述第一交集数据的线上特征集和所述第二交集数据的第一线下特征集不相同,并且所述第一交集数据的线上预估值集合和所述第二交集数据的第一线下评估值集合不相同,则确定所述第一交集数据和所述第二交集数据之间存在样本差异。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取在所述线下系统中对所述第一交集数据进行特征提取,并利用所述机器学习模型对该特征提取的结果进行评估,得到的第二线下评估值集合;
获取在所述线下系统中利用所述机器学习模型对所述第一交集数据的线上特征集进行评估,得到的第三线下评估值集合;
分别计算所述第一线下评估值集合、所述第二线下评估值集合、所述第三线下评估值集合以及所述第一交集数据的线上预估值集合各自对应的ROC曲线下方的面积大小AUC,并通过比较所述各自对应的AUC的衰减幅度,确定不同问题的影响程度。
6.根据权利要求5所述的方法,其特征在于,所述通过比较所述各自对应的AUC的衰减幅度,确定不同问题的影响程度,包括:
如果所述第一交集数据的线上预估值集合的AUC衰减幅度大,则确定计算预估值集合的问题影响大;或
如果所述第二线下评估值集合的AUC衰减幅度大,则确定样本差异问题影响大;或
如果所述第三线下评估值集合的AUC衰减幅度大,则确定特征抽取的问题影响大。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
如果所述第三线下评估值集合和所述第一交集数据的线上预估值集合不相同,则确定所述机器学习模型在评估阶段和预估阶段中存在预估逻辑不匹配问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010322893.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种搜索方法、装置、终端设备及存储介质
- 下一篇:连接器壳体组件