[发明专利]一种基于大数据的小型企业失信预测方法在审
申请号: | 201910021425.3 | 申请日: | 2019-01-10 |
公开(公告)号: | CN109740764A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 童毅;周波依 | 申请(专利权)人: | 博拉网络股份有限公司 |
主分类号: | G06N99/00 | 分类号: | G06N99/00;G06Q10/06;G06Q40/02 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 卢胜斌 |
地址: | 401121 重庆市*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 小型企业 构建 数据集 企业信息 预测结果 大数据 机器学习领域 机器学习模型 数据预处理 预处理操作 足迹 工程构建 基本信息 离散特征 模型线性 数据集中 统计特征 线性融合 信息构建 预测 评估 裁判 融合 | ||
1.一种基于大数据的小型企业失信预测方法,其特征在于,包括:
S1、根据企业的行为足迹信息构建数据集;
S2、对数据集进行预处理操作;
S3、对数据集中的企业信息进行特征工程构建操作,构建统计特征、离散特征;
S4、构建多个机器学习模型并进行线性加权融合操作;
S5、对已建立的模型,根据企业的行为足迹信息对小型企业是否失信,得到企业失信概率,给出预测结果实现对小型企业失信行为的精准评估。
2.根据权利要求1所述的一种基于大数据的小型企业失信预测方法,其特征在于,所述企业的行为足迹信息包括企业基本信息、企业民商事裁判文书、企业民商事审判流程、企业的行政违法记录、企业欠税信息、企业纳税信息以及企业限制高消费信息。
3.根据权利要求2所述的一种基于大数据的小型企业失信预测方法,其特征在于,企业基本信息包括小微企业ID、注册资金、注册资本币种、企业类型、行业门类代码、许可经营项目、一般经营项目、经营范围、成立日期、从业人数、投资总额、投资总额币种;企业民商事裁判文书信息包括小微企业ID、诉讼地位、审理机关、涉案事由、涉案金额、文书类型、审理程序、结案时间;企业民商事审判流程信息包括小微企业ID,诉讼地位、审理机关、涉案是由、审理进度、具体日期;企业违法记录信息包括小微企业ID、违法信息、具体日期;企业欠税信息包括小微企业ID、欠税金额、所欠税种、具体日期;企业纳税信息包括小微企业ID、主管税务机关、所欠税种、欠税属期、欠税金额、具体日期;企业限制高消费信息小微企业ID、是否被限制高消费。
4.根据权利要求1所述的一种基于大数据的小型企业失信预测方法,其特征在于,预处理操作包括对数据集的信息按照结案时间或者具体日期进行排序,对企业基本信息注册资金、投资总额进行单位统一以及对缺失值的填充。
5.根据权利要求4所述的一种基于大数据的小型企业失信预测方法,其特征在于,统计特征包括企业欠税次数、企业违法次数、企业所欠税种排名前10的税种的欠税次数、企业被告排名前10的被告原因的被告次数以及企业民商事涉案金额。
6.根据权利要求1所述的一种基于大数据的小型企业失信预测方法,其特征在于,离散特征的筛选包括将注册资本和行业门类代码属性列分别进行独热one-hot编码并筛选出现次数过少的特征作为离散特征。
7.根据权利要求1所述的一种基于大数据的小型企业失信预测方法,其特征在于,对缺失值的填充包括根据欧式距离分析来确定距离缺失数据最近的K个样本,将这K个值加权平均作为该样本的缺失数据。
8.根据权利要求1所述的一种基于大数据的小型企业失信预测方法,其特征在于,步骤S4包括建立多个模型,包括SVM机器学习模型、LightGBM机器学习模型、XGBoost机器学习模型、CatBoost机器学习模型。
9.根据权利要求8所述的一种基于大数据的小型企业失信预测方法,其特征在于,步骤S4中进行线性融合操作包括:
Y=x1×w1+x2×w2+x3×w3+x4×w4;
其中,Y表示预测结果;x1表示SVM机器学习模型,w1表示SVM机器学习模型的权值;x2表示LightGBM模型,w2表示LightGBM机器学习模型的权值;x3表示XGBoost模型,w3表示XGBoost机器学习模型的权值;x4表示CatBoost模型,w4表示CatBoost机器学习模型的权值。
10.根据权利要求9所述的一种基于大数据的小型企业失信预测方法,其特征在于,其中将SVM机器学习模型的权值w1为0.05;LightGBM机器学习模型的权值w2为0.5;XGBoost机器学习模型的权值w3为0.25;CatBoost机器学习模型的权值w4为0.2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博拉网络股份有限公司,未经博拉网络股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910021425.3/1.html,转载请声明来源钻瓜专利网。