[发明专利]基于知识图谱识别空壳公司的方法及系统在审
申请号: | 202210385546.8 | 申请日: | 2022-04-13 |
公开(公告)号: | CN115115380A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 于航;钱吟霄;倪伟渊;黄乐平;茅天天;朱琨 | 申请(专利权)人: | 江苏省联合征信有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06Q50/00;G06F16/36 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶涓涓 |
地址: | 210000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 识别 空壳 公司 方法 系统 | ||
1.基于知识图谱识别空壳公司的方法,其特征在于,包括如下步骤:
步骤一,对企业间关系进行关联,具体包括:
生成系统中所有企业两两之间的一级关联特征,遍历所有一级关联特征不为0的组合,生成每组两个企业间的二级和三级关联特征,计算每组两个企业的关联特征之和;关联特征分为三类,一级关联特征包括人员、联系方式、登录设备,其中人员包括法人、最终受益人、股东、高管;联系方式包括工商注册地址、工商注册电话、登录注册电话;登录设备包括登录IP、MAC、IMEI;二级关联特征包括注册资本、实缴资本、注册时间、核准时间、企业类型、行业类型、经营范围、登记机关;三级关联特征包括一级特征和二级特征的变更时间和变更内容;
步骤二,通过图谱模块度与社区划分算法划分社区,得到最大化图谱模块度的社区划分,并计算每个社区的关联特征指数,具体包括:
两个顶点g和h之间边的权重为二者关联特征之和F(g,h),即
F(g,h)=F1(g,h)+F2(g,h)+F3(g,h)
将每个社区内所有连接顶点的边的权重之和,作为每个社区对应的内部关联特征和,将所有社区的上述内部关联特征和之和,作为社区网络关联特征和;将所有连接不同社区的两个顶点所对应的边的权重之和,作为社区间关联特征和;将上述社区网络关联特征和与上述社区间关联特征和之差,作为该图谱的模块度;通过最大化图谱模块度的算法进行社区划分;完成社区划分后,计算每个社区的关联特征指数,用于标识每个社区企业关联关系的强度;每个社区的关联特征指数=该社区内部关联特征和/该社区顶点数量;
步骤三,通过经营活力评分模型对目标企业的经营活力进行评分,具体包括:
经营活力评分模型获取目标企业的历史数据及企业所属行业的行业数据;依据所述的历史数据和行业数据,获得所述目标企业和所述行业的各维度数据在五个预设时间段内对应的平均值,通过所述目标企业平均值/行业平均值确定五个预设时间段内目标企业各维度数据在行业内的等级指标;通过目标企业在行业内的等级在五个预设时间段内的变化,确定企业各维度数据的趋势指标;将目标企业的等级指标、趋势指标以及行业类型作为特征向量输入经营活力评分模型,输出所述目标企业的经营活力评分;
步骤四,从预设的数据库中获取空壳样本企业的经营活力评分以及其所在社区的关联特征指数,通过非线性Logistic回归拟合分类,确定样本中空壳企业活力评分与所在社区关联特征指数间的拟合曲线,获取曲线下方的部分为空壳预警区域并进行空壳预警。
2.根据权利要求1所述的基于知识图谱识别空壳公司的方法,其特征在于,企业两两之间的各级关联特征计算方法如下:
两个工商注册企业g,h间一级特征关联特征通过下式计算:
其中μ、ρ、σ为S、C、E下关联特征的预设权重;
如果两个工商注册企业间F1不为0,则计算两个实体的二级关联特征如下:
其中τ为关联特征A的预设权重;
如果两个工商注册企业间的F1不为0,则计算两个实体的三级关联特征如下:
其中和ω为关联特征U和V的预设权重。
3.根据权利要求1所述的基于知识图谱识别空壳公司的方法,其特征在于,所述步骤三中,经营活力评分模型基于机器学习算法对样本企业的数据进行训练得到。
4.根据权利要求3所述的基于知识图谱识别空壳公司的方法,其特征在于,所述样本企业为贷款申请企业,包含已成功获得贷款的企业和申请被拒绝的企业。
5.根据权利要求3所述的基于知识图谱识别空壳公司的方法,其特征在于,所述历史数据涵盖以下三个维度:
(1)企业资产类:注册资本、实缴资本、专利申请、不动产登记、机动车登记、及以上特征的时间序列特征;
(2)企业经营类:招投标、招聘、荣誉资质、工商年报的人数、收入与净利润、电力缴费、社保缴费、纳税、信贷、及以上特征的时间序列特征;
(3)政府公告类:行政许可、行政处罚、经营异常移入-无法联系该企业、经营异常移入-未公示年报、经营异常移出、简易注销、注销备案、欠税公告、及以上特征的时间序列特征;
所述行业数据为该行业中的企业在以上三个维度汇总所得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省联合征信有限公司,未经江苏省联合征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210385546.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种麦冬种植方法
- 下一篇:一种基于三元组的多模态协同场景识别方法