[发明专利]树模型的对象可解释性特征提取方法、装置、设备及介质在审
申请号: | 202210063863.8 | 申请日: | 2022-01-20 |
公开(公告)号: | CN114399000A | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 魏一傲 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N7/00 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 武志峰 |
地址: | 518000 广东省深圳市福田区福田街道益田路5033号平安*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 对象 解释性 特征 提取 方法 装置 设备 介质 | ||
本发明涉及人工智能领域,提供一种树模型的对象可解释性特征提取方法、装置、设备及介质,能够根据每个分裂特征在每个弱分类器中的衰减值及每个弱分类器的权重计算转移概率,并根据转移概率对每个分裂特征进行特征融合,筛选出贡献最大的节点作为融合后的节点,使由此节点遍历得到的路径中每个节点的贡献值最大化,计算根据融合后的分裂特征构建的贝叶斯图中每条路径的联合概率,反映出每条路径的重要程度,获取联合概率最高的路径上所对应的特征作为对象可解释性特征,以识别重要路径,从多个特征维度同时考虑影响最显著的特征,辅助确定业务上的判别规则,提高输出结果的可解释性。本发明还涉及区块链技术,目标模型可以存储于区块链节点上。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种树模型的对象可解释性特征提取方法、装置、设备及介质。
背景技术
随着人工智能的不断发展,模型的可解释性在业务场景中的应用愈发重要。
树模型是当前运用较多的一种算法,运行逻辑较为简单,容易理解,但是,目前的方案只能输出树模型中的特征重要性程度,尚无法判断树模型中的重要路径。例如:SHAP(SHapley Additive exPlanations)是业内较成熟的模型可解释性算法,该算法通过博弈论的理论计算树模型特征路径上的特征边际贡献值,并返回特征重要性,能提示特征贡献的方向,但是不能识别树模型中的重要路径。
因此,在对象甄选场景(如保险代理人甄选)中,由于现有的模型可解释性方案还不能实现对树模型中重要路径的判断,模型的可解释性还有待提高,也就无法给出对象留存的合理解释,不利于对对象的甄选。
发明内容
本发明实施例提供了一种树模型的对象可解释性特征提取方法、装置、设备及介质,旨在解决对象甄选场景中模型可解释性不强的问题。
第一方面,本发明实施例提供了一种树模型的对象可解释性特征提取方法,其包括:
获取多个对象的至少一个特征对应的数据构建训练样本集,并利用所述训练样本集训练树模型,得到目标模型;
确定所述目标模型中每个弱分类器的类型,并根据每个弱分类器的类型计算所述目标模型中每个弱分类器的权重;
对于所述训练样本集中的每个训练样本,在所述目标模型中选择每个训练样本对应的每个特征的目标分裂点,并根据每个特征的目标分裂点确定每个样本的路径;
获取每个样本的路径中的分裂特征,并计算每个分裂特征在每个弱分类器中的衰减值;
根据每个分裂特征在每个弱分类器中的衰减值及每个弱分类器的权重计算每个分裂特征在每个弱分类器中的转移概率;
根据每个分裂特征在每个弱分类器中的转移概率对每个分裂特征进行特征融合;
根据融合后的分裂特征构建贝叶斯图,并计算所述贝叶斯图中每条路径的联合概率;
获取所述联合概率最高的路径上所对应的特征作为所述对象可解释性特征。
根据本发明优选实施例,所述根据每个弱分类器的类型计算所述目标模型中每个弱分类器的权重包括:
当每个弱分类器的类型都为引导聚集算法类型时,获取所述目标模型中所述弱分类器的总数量,并计算所述总数量的倒数作为每个弱分类器的权重;或者
当每个弱分类器的类型都为提升算法类型时,计算每个弱分类器的信息熵增益,并按照每个弱分类器的信息熵增益确定每个弱分类器的权重分配比例,根据每个弱分类器的权重分配比例计算每个弱分类器的权重。
根据本发明优选实施例,所述在所述目标模型中选择每个训练样本对应的每个特征的目标分裂点包括:
计算每个特征在分裂前的信息熵;
计算每个特征在分裂后的信息熵的和;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210063863.8/2.html,转载请声明来源钻瓜专利网。