[发明专利]一种SHAP的优化方法、设备及介质有效
申请号: | 202110994859.9 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113723618B | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 张燕;杨一帆;唐剑飞 | 申请(专利权)人: | 南京星环智能科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 马迪 |
地址: | 210004 江苏省南京市建*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 shap 优化 方法 设备 介质 | ||
本发明实施例公开了一种SHAP的优化方法、设备及介质。其中,方法包括:基于第一目标计算方式计算SHAP基准值;根据采样样本数量生成掩码权重值;基于第二目标计算方式对训练样本集进行压缩处理,得到训练压缩样本;根据训练压缩样本和待解释样本生成采样样本;基于第三目标计算方式计算采样样本的模型预测结果;基于第四目标计算方式根据SHAP基准值、掩码权重值以及采样样本的模型预测结果确定SHAP结果值。本发明实施例的技术方案能够降低模型解释的计算量,提升模型解释的计算效率。
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种SHAP的优化方法、设备及介质。
背景技术
随着人工智能的发展,机器学习的应用也越来越广泛。一些简单模型(线性模型等)因易于解释以及性能高的特点受到青睐,但是简单模型的精度有限,使得在具有高精度要求的应用场景中复杂模型越来越受欢迎,而复杂模型大部分属于黑盒模型,具有不透明、非直观以及难以理解的特点。基于复杂模型的上述特点使得复杂模型存在精度和可解释性之间的紧张关系。正确解释复杂模型的输出结果可以便于技术人员理解,还可以建立模型使用者的信任,同时还能够反向指导模型优化,由此可见正确解释复杂模型的输出结果至关重要。
SHAP(SHapley Additiveex Planations,沙普利可加性模型解释方法)作为特征重要性的统一量度方法,成为当前通用的模型的解释方法,但是SHAP主要通过对大量训练样本进行单机计算实现对模型的解释,而SHAP的计算量与训练样本成线性增长关系,与训练样本的特征维度成指数增长,因此通过SHAP对模型进行解释时存在计算量大,计算效率低的问题。
发明内容
本发明实施例提供一种SHAP的优化方法、设备及介质,能够降低模型解释的计算量,提升模型解释的计算效率。
第一方面,本发明实施例提供了一种SHAP的优化方法,包括:
基于第一目标计算方式计算SHAP基准值;
根据采样样本数量生成掩码权重值;
基于第二目标计算方式对训练样本集进行压缩处理,得到训练压缩样本;
根据训练压缩样本和待解释样本生成采样样本;
基于第三目标计算方式计算采样样本的模型预测结果;
基于第四目标计算方式根据SHAP基准值、掩码权重值以及采样样本的模型预测结果确定SHAP结果值。
第二方面,本发明实施例还提供一种SHAP的优化方法的装置,包括:
SHAP基准值计算模块,用于基于第一目标计算方式计算SHAP基准值;
掩码权重值生成模块,用于根据采样样本数量生成掩码权重值;
训练压缩样本获取模块,用于基于第二目标计算方式对训练样本集进行压缩处理,得到训练压缩样本;
采样样本生成模块,用于根据训练压缩样本和待解释样本生成采样样本;
模型预测结果的计算模块,用于基于第三目标计算方式计算采样样本的模型预测结果;
SHAP结果值确定模块,用于基于第四目标计算方式根据SHAP基准值、掩码权重值以及采样样本的模型预测结果确定SHAP结果值。
第三方面,本发明实施例还提供了一种计算机设备,包括处理器和存储器,存储器用于存储指令,当指令执行时使得处理器执行以下操作:
基于第一目标计算方式计算SHAP基准值;
根据采样样本数量生成掩码权重值;
基于第二目标计算方式对训练样本集进行压缩处理,得到训练压缩样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京星环智能科技有限公司,未经南京星环智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110994859.9/2.html,转载请声明来源钻瓜专利网。