[发明专利]模型解释方法、装置、电子设备及存储介质在审
申请号: | 202210282784.6 | 申请日: | 2022-03-22 |
公开(公告)号: | CN114625657A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 陆凯 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 赵伟杰 |
地址: | 518000 广东省深圳市福田区福田街道益田路5033号平安*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 解释 方法 装置 电子设备 存储 介质 | ||
1.一种模型解释方法,其特征在于,所述方法包括:
获取预先训练好的黑盒模型、目标任务场景的样本集合和待解释的目标样本;
将所述样本集合输入至所述黑盒模型中,得到特征分布信息;
对所述目标样本输入至所述黑盒模型进行模型预测,得到模型预测分数;
遍历所述目标样本中每个维度的特征,根据所述特征分布信息计算每个维度所述特征对应的加权平均分;
根据所述加权平均分与所述模型预测分数的差异值,确定每个维度所述特征在所述目标样本的重要程度;
根据所述特征的重要程度对所述黑盒模型基于所述目标样本的模型进行解释。
2.根据权利要求1所述的方法,其特征在于,所述特征分布信息包括有所述样本集合中每个维度所述特征对应的特征值以及所述特征值在所述样本集合中的占比。
3.根据权利要求2所述的方法,其特征在于,所述根据所述特征分布信息计算每个维度所述特征对应的加权平均分,包括:
将所述目标样本中每个维度所述特征替换为所述样本集合中同一维度的特征对应的特征值,得到新样本;
通过所述黑盒模型对所述新样本进行模型评分,得到模型评分分数;
根据所述模型评分分数和所述特征值在所述样本集合中的占比,得到所述目标样本中每个维度所述特征对应的加权平均分。
4.根据权利要求1所述的方法,其特征在于,所述根据所述加权平均分与所述模型预测分数的差异值,确定每个维度所述特征在所述目标样本的重要程度,包括:
计算每个维度所述特征对应的所述加权平均分与所述模型预测分数之差,得到第一差异值;
计算全部维度所述特征对应的所述加权平均分与所述模型预测分数之差,得到第二差异值;
根据所述第一差异值除以所述第二差异值,得到第一特征重要程度值,其中,所述第一特征重要程度值用于表征每个维度所述特征在所述目标样本的重要程度,且所述第一特征重要程度值的大小与所述重要程度成正比。
5.根据权利要求4所述的方法,其特征在于,所述根据所述重要程度对所述黑盒模型基于所述目标样本的模型进行解释,包括:
对所述特征按照所述第一特征重要程度值的大小进行排序;
确定所述第一特征重要程度值最高的前N个特征;
采用前N个所述特征对所述黑盒模型基于所述目标样本的模型进行局部可解释,其中,N为大于零的正整数。
6.根据权利要求4所述的方法,其特征在于,所述根据所述重要程度对所述黑盒模型基于所述目标样本的模型进行解释,包括:
计算所述样本集合中每个样本每个维度的特征对应的所述第一特征重要程度值;
对每个样本每个维度的特征对应的所述第一特征重要程度值之和求平均值,得到第二特征重要程度值,其中,所述第二特征重要程度值用于表征每个维度所述特征在所述样本集合的重要程度,且所述第二特征重要程度值的大小与所述重要程度成正比;
对所述样本集合中每个维度所述特征按照所述第二特征重要程度值的大小进行排序;
确定所述第二特征重要程度值最高的前N个维度的特征;
采用前N个维度的所述特征对所述黑盒模型基于所述目标样本的模型进行全局可解释,其中,N为大于零的正整数。
7.根据权利要求1至6任意一项所述的方法,其特征在于,所述黑盒模型为分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210282784.6/1.html,转载请声明来源钻瓜专利网。