[发明专利]一种适用于校验企业代码的系统及方法在审
申请号: | 202111375154.5 | 申请日: | 2021-11-18 |
公开(公告)号: | CN114266287A | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 吴伟刚;时光;倪冉;孙少平;于舜诰;潘竞旭;鲁龙 | 申请(专利权)人: | 航天信息股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 刘海蓉 |
地址: | 100195 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 校验 企业 代码 系统 方法 | ||
1.一种适用于校验企业代码的系统,所述系统包括:
赋码模块,所述赋码模块对目标企业所属的行业类别进行分类,分类完成后对目标企业赋予企业行业代码;
采集模块,所述采集模块根据所述目标企业的企业行业代码,生成目标企业的信息采集表;
所述信息采集表采集目标企业的指标项数据;
检验模块,所述校验模块根据所述指标项数据预测目标企业的企业代码,若企业代码与所述赋码模块赋予目标企业的企业行业代码一致,则目标企业的企业代码校验通过。
2.根据权利要求1所述的系统,所述赋码模块对目标企业所属的行业类别进行分类,具体包括如下步骤:
获取目标企业业务活动数据,将所述业务活动数据作为样本数据;
对所述样本数据进行分词;
针对分词后的样本数据,基于TF-IDF算法提取分词后的样本数据的特征值;
将所述特征值输入至GBDT模型,对目标企业业务活动进行分类;
根据所述目标企业的业务活动,对所述目标企业所属的行业类别进行分类。
3.根据权利要求2所述的系统,所述对所述样本数据进行分词,使用jieba分词工具进行分词,所述分词具体为:剔除样本数据中的无用词,并通过样本数据中词语的词性,保留样本数据的动词和名词。
4.根据权利要求1所述的系统,所述采集模块,包括:报表制作单元、报表发送单元和报表填报单元;
报表制作单元,提供可视化报表制作组件,用于初始化不同行业代码所对应的企业信息采集表;
报表发送单元,根据目标企业所对应的行业代码,自动发送企业信息采集表到目标企业;
报表填报单元,用于查看需填报的目标企业信息采集表,填写企业信息采集表中对应的指标项数据。
5.根据权利要求1所述的系统,所述根据指标项数据预测目标企业的企业代码,具体包括如下步骤:
将所述指标项数据作为预测样本数据;
对所述预测样本数据进行特征向量化处理;
将处理后的预测样本数据输入GBDT模型进行计算,输出预测的目标企业的企业代码。
6.一种适用于校验企业代码的方法,所述方法包括:
对目标企业所属的行业类别进行分类,分类完成后对目标企业赋予企业行业代码;
根据所述目标企业的企业行业代码,生成目标企业的信息采集表;
所述信息采集表采集目标企业的指标项数据;
根据所述指标项数据预测目标企业的企业代码,若企业代码与所述赋予目标企业的企业行业代码一致,则目标企业的企业代码校验通过。
7.根据权利要求6所述的系统,所述对目标企业所属的行业类别进行分类,具体包括如下步骤:
获取目标企业业务活动数据,将所述业务活动数据作为样本数据;
对所述样本数据进行分词;
针对分词后的样本数据,基于TF-IDF算法提取分词后的样本数据的特征值;
将所述特征值输入至GBDT模型,对目标企业业务活动进行分类;
根据所述目标企业的业务活动,对所述目标企业所属的行业类别进行分类。
8.根据权利要求7所述的方法,所述对所述样本数据进行分词,使用jieba分词工具进行分词,所述分词具体为:剔除样本数据中的无用词,并通过样本数据中词语的词性,保留样本数据的动词和名词。
9.根据权利要求6所述的方法,所述根据指标项数据预测目标企业的企业代码,具体包括如下步骤:
将所述指标项数据作为预测样本数据;
对所述预测样本数据进行特征向量化处理;
将处理后的预测样本数据输入GBDT模型进行计算,输出预测的目标企业的企业代码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111375154.5/1.html,转载请声明来源钻瓜专利网。