[发明专利]企业行业分类方法及其装置在审
申请号: | 201811237531.7 | 申请日: | 2018-10-23 |
公开(公告)号: | CN110245226A | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 金瑞峰;韦东杰;苏斌;苗璐;林凉;郭向国;戴才良 | 申请(专利权)人: | 爱信诺征信有限公司;航天信息股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/951;G06F17/27;G06K9/62 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100093 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行业分类 分类 数据模型 行业预测 基础数据 数据对应 综合分析 工作量 标注 智能 申请 | ||
1.一种企业行业分类方法,其特征在于,包括:
获取企业的多种基础数据,并从中选取数据以建立与选取的数据对应的数据模型;
根据所述数据模型得到所述企业的行业预测分类;
将多个所述企业的行业预测分类综合分析得到所述企业的行业最终分类。
2.根据权利要求1所述的方法,其特征在于,选取数据之后,建立与选取的数据对应的数据模型之前,还包括对所述选取的数据进行预处理。
3.根据权利要求2所述的方法,其特征在于,对所述选取的数据进行预处理操作包括以下至少一种:使用分词工具对数据进行分词处理;删除所述选取的数据中的重复数据;平滑噪声数据。
4.根据权利要求1所述的方法,其特征在于,所述多种基础数据包括所述企业名称数据、经营范围数据、主营商品数据、上游企业代码数据和下游企业代码数据中的至少一种。
5.根据权利要求1所述的方法,其特征在于,所述从中选取数据以建立与选取的数据对应的数据模型,包括,从所述多种基础数据中选取一种数据或者多种数据,对所述选取的数据进行向量化处理,根据设定的第一算法,建立对应的数据模型。
6.根据权利要求5所述的方法,其特征在于,所述设定的第一算法包括卷积神经网络方法,MLPC方法和Logistic回归方法中的至少一种。
7.根据权利要求1所述的方法,其特征在于,所述将多个所述企业的行业预测分类综合分析得到所述企业的行业最终分类包括,使用设定的第二算法,对多个所述企业的行业预测分类综合分析,得到所述企业的行业最终分类。
8.根据权利要求1所述的方法,其特征在于,所述根据所述数据模型得到所述企业的行业预测分类之前,还包括,从数据库中随机提取设定比例的所述基础数据,所述基础数据的种类与建立所述数据模型的种类相对应,通过对提取的数据进行分析,得到企业的行业准确分类,所述数据模型对所述行业准确分类进行学习。
9.一种企业行业分类装置,其特征在于,包括:
建模单元,用于获取企业的多种基础数据,并从中选取数据以建立与选取的数据对应的数据模型;
预测分类单元,用于根据所述数据模型得到所述企业的行业预测分类;
分析单元,用于将多个所述企业的行业预测分类综合分析得到所述企业的行业最终分类。
10.一种企业行业分类系统,其特征在于,包括:数据服务器和前端设备,所述数据服务器用于存储企业的多种基础数据;所述前端设备配置有一个或者多个处理器,所述处理器用于:获取企业的多种基础数据,并从中选取数据以建立与选取的数据对应的数据模型;根据所述数据模型得到所述企业的行业预测分类;将多个所述企业的行业预测分类综合分析得到所述企业的行业最终分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于爱信诺征信有限公司;航天信息股份有限公司,未经爱信诺征信有限公司;航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811237531.7/1.html,转载请声明来源钻瓜专利网。