[发明专利]量化机器学习模型中的偏差在审
申请号: | 201910693269.5 | 申请日: | 2019-07-30 |
公开(公告)号: | CN110782037A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | K·肯塔帕迪;S·C·盖伊克;S·M·安布勒 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 72002 永新专利商标代理有限公司 | 代理人: | 张立达 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 所公开的实施例提供了一种用于量化机器学习模型偏差的系统。在操作期间,系统获得与请求的参数相匹配的合格候选者集合。接下来,在合格候选者被输入到机器学习模型中之后,系统获得由机器学习模型输出的推荐候选者的排名。然后,系统生成属性在推荐候选者的排名中的第一分布和该属性在合格候选者中的第二分布。该系统还基于第一分布和第二分布来计算偏斜度量,所述偏斜度量表示属性值在推荐候选者的排名中的第一比例与该属性值在合格候选者中的第二比例之间的差异。最后,系统输出偏斜度量,以用于评估机器学习模型中的偏差。 | ||
搜索关键词: | 机器学习模型 度量 偏斜 操作期间 系统生成 系统输出 匹配 集合 量化 输出 评估 | ||
【主权项】:
1.一种方法,包括:/n获得与请求的参数相匹配的合格候选者集合;/n在所述合格候选者集合被输入到机器学习模型中之后,获得由所述机器学习模型输出的推荐候选者的排名,其中,所述推荐候选者是所述合格候选者集合的子集;/n由一个或多个计算机系统生成属性在所述推荐候选者的排名中的第一分布和所述属性在所述合格候选者集合中的第二分布;/n由所述一个或多个计算机系统基于所述第一分布和所述第二分布来计算偏斜度量,所述偏斜度量表示所述属性的属性值在所述推荐候选者的排名中的第一比例与所述属性值在所述合格候选者集合中的第二比例之间的差异;以及/n输出所述偏斜度量以用于评估所述机器学习模型中的偏差。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910693269.5/,转载请声明来源钻瓜专利网。