[发明专利]一种空壳企业确定方法及装置、空壳企业监测方法及装置在审

专利信息
申请号: 202011513583.X 申请日: 2020-12-18
公开(公告)号: CN113159084A 公开(公告)日: 2021-07-23
发明(设计)人: 孙明月;王宏刚;刘识;王倩;彭放;孙妮;简燕红;张海峰;米娜;崔琪;马寒梅;邓祥瑞;吴颖波;杨涛 申请(专利权)人: 国家电网有限公司大数据中心
主分类号: G06K9/62 分类号: G06K9/62;G06Q10/06;G06Q10/04
代理公司: 北京万思博知识产权代理有限公司 11694 代理人: 范晓斌
地址: 100000 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 空壳 企业 确定 方法 装置 监测
【说明书】:

发明提供了一种空壳企业确定方法及装置、空壳企业监测方法及装置。该空壳企业确定方法包括:从全量样本中选取出m个样本作为训练样本集;从训练样本集中选出n个正样本作为第一正样本集,并从第一正样本集中选取出s个正样本作为第二正样本集;对第二正样本集中所有正样本进行标记作为标签样本,将训练样本集中其他未标记的m‑s个样本作为无标签样本;利用训练样本集,且以是否为标签样本来训练预设分类器;利用已经训练好的预设分类器对全量样本进行预测,从而获得全量样本中各样本为正样本的概率值以及根据该概率值确定的分类结果;在分类结果是确定为正样本时,确定对应的样本为空壳企业。本发明方案可以准确地确定出某个样本是否为空壳公司。

技术领域

本发明涉及计算机技术领域,尤其涉及一种空壳企业确定方法、装置、空 壳企业监测方法及装置。

背景技术

据相关研究机构分析,2019年底中国空壳公司数量超过450万家,每10 家企业中即有1家疑似空壳公司;近一年指向中性或负面目的所设立的空壳公 司增速达25%。

目前法律上对空壳企业没有一个明确的定义。对企业传统意义上的监测基 本依赖工商、税务、社保、质监等数据给出相关的参考信息。常见的企业空壳 监测方法有:

1.人工解读:具有相关专业知识的人士对企业数据指标进行分析解读。这 种方式存在着成本高,效率低下等问题。

2.传统的统计学模型:这种方法存在着诸多问题,比如筛选条件依赖专家 经验人工定义,而经验的主观性和局限性导致了筛选条件必然存在偏差;条件 死板导致分类的准确率低下;只能看到分类结果而无法得到概率、可信度等更 多信息。

3.机器学习方法建模:该方法需要对企业的各种数据及指标进行分析, 通过建模对企业的空壳风险进行评估。常用的机器学习方法包含有监督学习、 半监督学习和无监督学习。传统的监督学习方法,需要企业明确的空壳和非空 壳标签,而对企业添加空壳和非空壳标识需要消耗大量的时间和人力。无监督 学习则因为正负样本边界模糊和数据分布不均匀等问题,导致分类的可靠性不 足。

发明内容

本申请的一个目的在于提供一种建模以及模型训练效率高、结果准确的空 壳企业确定方法。

本申请的一个进一步的目的在于进一步提高模型预测结果的准确性以及 可靠性。

特别地,本申请提供了一种空壳企业确定方法,包括如下步骤:

从全量样本中选取出m个样本作为训练样本集;

从所述训练样本集中按照一预设条件筛选出n个正样本作为第一正样本 集,并从所述第一正样本集中选取出s个正样本作为第二正样本集;

对所述第二正样本集中所有正样本进行标记,并将已经标记的所述第二正 样本集中所有正样本作为标签样本,将训练样本集中其他未标记的m-s个样本 作为无标签样本;

利用所述训练样本集,且以是否为所述标签样本来训练预设分类器;

利用已经训练好的所述预设分类器对所述全量样本进行预测,从而获得所 述全量样本中各样本为正样本的概率值以及根据该概率值确定的分类结果,所 述分类结果包括确定为正样本和确定为负样本;

在所述分类结果是确定为正样本时,确定对应的样本为空壳企业。

可选地,利用已经训练好的所述预设分类器对所述全量样本进行预测,从 而获得所述全量样本中各样本为正样本的概率值以及根据该概率值确定的分 类结果,包括如下步骤:

利用已经训练好的所述预设分类器对所述全量样本进行预测,获得所述全 量样本中各样本为所述标签样本的概率值Pj,其中,Pj为第j个样本为所述标 签样本的概率值;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司大数据中心,未经国家电网有限公司大数据中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011513583.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top