[发明专利]基于决策树和LIME模型的解释方法、系统、设备和介质在审

申请号：	202210713933.X	申请日：	2022-06-22
公开（公告）号：	CN115204411A	公开（公告）日：	2022-10-18
发明（设计）人：	不公告发明人	申请（专利权）人：	杭州博盾习言科技有限公司
主分类号：	G06N20/00	分类号：	G06N20/00;G06N5/04
代理公司：	杭州创智卓英知识产权代理事务所(普通合伙) 33324	代理人：	唐超文
地址：	310000 浙江省杭州市余***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于决策树 lime 模型解释方法系统设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例涉及基于决策树和LIME模型的解释方法、系统、设备和介质，属于机器学习技术领域，该方法包括：获取待推理样本并提取特征数据，将所述特征数据输入预训练的黑盒模型，输出所述待推理样本的预测标签；将所述待推理样本的特征数据输入预训练的解释器模型，其中，所述解释器模型包括决策树和LIME模型，所述决策树根据各节点对应的LIME模型的拟合结果生成；根据所述决策树的决策路径和所述决策树的叶子节点对应的LIME模型的特征权重，得到所述预测标签的解释依据。根据本申请实施例，推理解释过程复杂度极低，速度快，能够降低延时；而且得到的解释依据更加全面，更加准确。

技术领域

本申请涉及机器学习技术领域，特别是涉及一种基于决策树和LIME模型的解释方法、系统、设备和介质。

背景技术

近年来，机器学习技术日渐成熟，逐渐在金融、医疗等行业发挥重要作用。机器学习模型被广泛地应用到一些重要的现实任务中，如人脸识别、自动驾驶、金融风控、智慧医疗等。在某些场景中，机器学习的表现甚至超越了人类。

机器学习的过程和结果需要借助机器学习模型来实现，但部分模型由于缺乏可解释性，其应用也饱受质疑。例如，在使用传统机器学习模型或者深度神经网络模型进行结果预测时，普通用户只能进行数据输入，被动等待模型的预测结果，对于模型的具体决策过程则一无所知。这些模型如同黑箱-般，无法提供其决策依据，由于模型的决策过程缺乏可解释性，用户无法判断其决策结果是否可靠。而缺乏可解释性的模型，应用在实际任务中，尤其是安全敏感的任务中，可能存在一定的安全隐患。例如，在智慧医疗领域，缺乏可解释性的黑盒模型，导致输出的病症缺乏判断依据，可能会给某位患者带来错误的治疗方案，危害患者生命安全；在自动驾驶领域，缺乏可解释性的黑盒模型，导致司机对于路况的判断缺乏依据，可能选择错误的行驶操作，从而导致危险发生；而在金融领域，缺乏可解释性的黑盒模型，影响市场人员对风险的预测，也有可能引起巨大的金融风险。

目前，一般通过LIME(Local Interpretable Model-agnostic Explanations)模型对黑盒模型的预测结果进行解释。例如，对待推理样本y通过黑盒模型得出预测标签，在对预测标签进行解释时，首先，统计原始数据得到数据集中样本的分布情况，生成该待推理样本y的近邻样本组Y，并利用该近邻样本组Y训练一个线性模型(即LIME模型)，再通过该线性模型的特征权重分布，来对该待推理样本y的预测结果进行解释。然而，这种推理解释的方式复杂度高，速度极慢，延时高。

发明内容

本申请实施例提供了一种基于决策树和LIME模型的解释方法、系统、设备和介质，以至少解决相关技术中推理解释方式复杂度高，速度极慢，延时高的问题。

第一方面，本申请实施例提供了一种基于决策树和LIME模型的解释方法，所述方法包括：获取待推理样本并提取特征数据，将所述特征数据输入预训练的黑盒模型，输出所述待推理样本的预测标签；将所述待推理样本的特征数据输入预训练的解释器模型，其中，所述解释器模型包括决策树和LIME模型，所述决策树根据各节点对应的LIME模型的拟合结果生成；根据所述决策树的决策路径和所述决策树的叶子节点对应的LIME模型的特征权重，得到所述预测标签的解释依据。

在其中一些实施例中，所述解释器模型的训练方式包括：获取训练样本集作为第一训练集，并通过预训练的黑盒模型输出所述第一训练集中样本的预测标签，用所述预测标签对所述样本进行重新标注，得到第二训练集；基于所述第二训练集训练决策树，递归执行节点的分裂，其中，在每个生成的节点上运行LIME模型以对节点内的样本进行线性回归拟合，得到LIME模型的特征权重和拟合误差；当所述拟合误差小于预设阈值时，退出递归。

在其中一些实施例中，所述解释器模型的训练方式还包括：当所述拟合误差不小于预设阈值时，分裂节点，直至节点内的样本数量小于预设的最小样本数，或者，即将分裂成的子节点的样本数量小于预设的最小分裂样本数，停止分裂。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州博盾习言科技有限公司，未经杭州博盾习言科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210713933.X/2.html，转载请声明来源钻瓜专利网。

上一篇：一种活性炭反复循环式工业废气处理装置
下一篇：高温工业废水热回收及蒸汽/热水供应系统及操作方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于决策树和LIME模型的解释方法、系统、设备和介质在审

专利文献下载