[发明专利]一种基于随机森林模型的报表生成方法及相关设备在审
申请号: | 202111275770.3 | 申请日: | 2021-10-29 |
公开(公告)号: | CN113901770A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 赵亚龙 | 申请(专利权)人: | 中国平安财产保险股份有限公司 |
主分类号: | G06F40/183 | 分类号: | G06F40/183;G06N3/00;G06N20/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市福田区益田路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 模型 报表 生成 方法 相关 设备 | ||
1.一种基于随机森林模型的报表生成方法,其特征在于,包括:
接收报表生成指令,所述报表生成指令携带第一字段集合,将所述第一字段集合输入至目标随机森林模型中;
在通过所述目标随机森林模型确定所述第一字段集合所包括的字段能生成报表的情况下,确定所述目标随机森林模型中包括所述第一字段集合的路径集合;
接收选择指令,所述选择指令携带路径标识,所述路径标识用于指示所述路径集合中的第一路径,所述第一路径为所述目标随机森林模型中决策树模型的路径,所述第一路径包括所述决策树模型的根节点至目标叶子节点;
确定在所述第一路径中的各个节点对应的字段为第二字段集合;
获取所述第二字段集合中各个字段对应的数据,并根据所述第二字段集合中各个字段以及各个字段对应的数据,生成第一报表。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一字段集合中的各个字段输入至目标随机森林模型中之前,所述方法还包括:
获取历史报表集合中的字段,并根据所述历史报表集合中字段确定第三字段集合;
从所述第三字段集合中随机选取N个字段,将选取的N个字段组成训练样本,得到第一训练样本集,所述N为大于1的整数;
在确定第二报表包括第一训练样本的N个字段的情况下,将所述第一训练样本确定为正样本,在确定所述第二报表不包括所述第一训练样本的N个字段的情况下,将所述第一训练样本确定为负样本;
其中,所述第二报表为所述历史报表集合中的任一报表,所述第一训练样本为所述第一训练样本集中的任一训练样本。
3.根据权利要求2所述的方法,其特征在于,所述将所述第一字段集合中的各个字段输入至目标随机森林模型之前,所述方法还包括:
确定所述第一训练样本集中包括第一字段的第一正样本个数和第一负样本个数,并确定所述第一训练样本集中包括所述第一字段的第一总训练样本个数,确定所述第一训练样本集中不包括所述第一字段的第二正样本个数和第二负样本个数,以及确定所述第一训练样本集中不包括所述第一字段的第二总训练样本个数,所述第一字段为所述第三字段集合中的任一字段;
其中,所述第一总训练样本个数为所述第一正样本个数与所述第一负样本个数之和,所述第二总训练样本个数为所述第二正样本个数与所述第二负样本个数之和;
确定所述第一正样本个数占所述第一总训练样本个数的第一比例,确定所述第一负样本个数占所述第一总训练样本个数的第二比例,确定所述第二正样本个数占所述第二总训练样本个数的第三比例,确定所述第二负样本个数占所述第二总训练样本个数的第四比例;
根据所述第一比例、所述第二比例、所述第三比例和所述第四比例,确定所述第一字段的第一基尼系数,并根据所述第一训练样本集合和所述第三字段集合中各个第一字段的第一基尼系数,构建第一决策树模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第三字段集合中各个第一字段的第一基尼系数,构建第一决策树模型之后,所述方法还包括:
从所述第三字段集合中随机选取M个字段,并将选取的M个字段组成训练样本,得到第二训练样本集,所述M为大于1的整数;
确定所述第三字段集合中各个字段的第二基尼系数,并根据所述第二训练样本集和所述第三字段集合中各个字段的第二基尼系数,构建第二决策树模型;
将所述第一决策树模型和所述第二决策树模型组合起来,得到目标随机森林模型。
5.根据权利要求4所述的方法,其特征在于,所述将所述第一字段集合输入至目标随机森林模型中之前,所述方法还包括:
确定所述目标随机森林模型中各个决策树模型的根节点至各个叶子节点的路径,得到多个路径;
确定所述多个路径中第二路径的各个节点的字段,得到第四字段集合,并从所述历史报表集合中获取包括所述第四字段集合所有字段的第三报表,所述第二路径为所述多个路径中的任一路径;
确定所述第三报表的数据处理方法,所述数据处理方法包括所述第四字段集合中各个字段对应的数据之间的计算方法以及报表配置模板,并将所述数据处理方法与所述第二路径对应存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安财产保险股份有限公司,未经中国平安财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111275770.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种安全带装置及车辆
- 下一篇:一种三维地图质量评估方法和系统