[发明专利]树形机器学习模型可视化方法、装置、电子设备及存储介质在审
申请号: | 202110462855.6 | 申请日: | 2021-04-28 |
公开(公告)号: | CN112883242A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 王小东;吕文勇;周智杰;杨军;赵小诣 | 申请(专利权)人: | 成都新希望金融信息有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/904;G06N20/00 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 唐菲 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 树形 机器 学习 模型 可视化 方法 装置 电子设备 存储 介质 | ||
本申请提供一种树形机器学习模型可视化方法、装置、电子设备及存储介质,涉及机器学习技术领域。所述方法包括:获取模型文件;提取所述模型文件的树状结构数据,并将所述树状结构数据组成指定Json格式数据,所述指定Json格式数据中包括所述树状结构数据的节点数据,所述节点数据包括每个节点是否为叶子结点、节点名称以及节点规则;通过D3.js将所述指定Json格式数据在页面进行树形展示和渲染。该方法可以对训练出的模型进行树形结构的解析,形成Json,并使用D3对Json进行加载,把模型进行可视化,以更好地理解模型,提升模型的可解释性。
技术领域
本申请涉及机器学习技术领域,具体而言,涉及一种树形机器学习模型可视化方法、装置、电子设备及存储介质。
背景技术
得益于人工智能技术的快速发展,基于人工智能技术可以解决很多实际的应用问题,如金融领域的风险评估、用户信用评分、用户还款意愿预测、用户资金充裕度预测、用户风险预测和用户疑似代偿识别等。用机器学习算法便可以很好的解决这些应用问题,机器学习算法有很多种,目前在各个领域表现比较好的算法主要是树状模型,如决策树、随机森林、GBDT、Xgboost和Catboost等。这些模型的优势在于其既可以用于回归,也可以用于分类,不需要特征缩放,而且具有比较好的可解释性。可视化的手段不仅是理解模型的好办法,也是向其他人介绍你的模型的运作机制的有利工具。但是如何对树状模型做可视化分析,以便于更多人理解树状模型做决策的机理是一个很有意义的课题。
具体地,决策树、随机森林、Xgboost、CatBoost、GBDT模型是最常用的树形机器学习模型,因为这些模型不是黑盒模型,所以它们是可以通过可视化进行理解,并且都是树状结构,可以使用一些树形可视化的手段进行展示的。Python中的大多数机器学习包都会输出一个模型文件,并且可以使用Graphviz工具进行模型可视化,但它们大都是静态图像,缺乏交互功能,有时候树模型很大,展示不全,也无法看到每一个结点的具体信息。同时,如何把一个模型文件进行结构化的树解析,形成一个递归的Json文件,也是一个难题,因此现有的机器模型可视化展示效果不佳。
发明内容
有鉴于此,本申请实施例的目的在于提供一种树形机器学习模型可视化方法、装置、电子设备及存储介质,以改善现有技术中存在的现有的机器模型可视化展示效果不佳的问题。
本申请实施例提供了一种树形机器学习模型可视化方法,所述方法包括:获取模型文件;提取所述模型文件的树状结构数据,并将所述树状结构数据组成指定Json格式数据,所述指定Json格式数据中包括所述树状结构数据的节点数据,所述节点数据包括每个节点是否为叶子结点、节点名称以及节点规则;通过D3.js将所述指定Json格式数据在页面进行树形展示和渲染。
在上述实现方式中,通过对模型进行树形结构的解析,形成Json格式数据,并使用D3对Json进行加载,把模型进行可视化,提升了模型可视化效率,且能够使用户更好地理解模型,提升模型的可解释性,同时将每个节点是否为叶子结点、节点名称以及节点规则在页面进行展示,从而提高了模型可视化的展示信息完整度。
可选地,所述获取模型文件,包括:获取Csv格式的模型训练数据;根据模型类型设置模型参数;基于所述模型训练数据和所述模型参数进行模型训练,以获得所述模型文件。
在上述实现方式中,通过Csv格式的模型训练数据和模型参数能够在后续的Python环境中对模型进行自动训练,从而提高了模型训练效率。
可选地,所述基于所述模型训练数据和所述模型参数进行模型训练,包括:利用Python的文件读取函数read_csv读取所述模型训练数据;将所述模型训练数据转换为dataFrame格式数据,并提取所述dataFrame格式数据中的特征X和标签列Y;获取所述模型参数,基于所述模型参数构建模型;将所述特征X和所述标签列Y代入model.fit函数对所述模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都新希望金融信息有限公司,未经成都新希望金融信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110462855.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:蓝牙信号的处理方法及装置
- 下一篇:一种雪花状涡轮叶片冷却结构