[发明专利]企业行业分类方法及其装置在审
申请号: | 201811237531.7 | 申请日: | 2018-10-23 |
公开(公告)号: | CN110245226A | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 金瑞峰;韦东杰;苏斌;苗璐;林凉;郭向国;戴才良 | 申请(专利权)人: | 爱信诺征信有限公司;航天信息股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/951;G06F17/27;G06K9/62 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100093 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行业分类 分类 数据模型 行业预测 基础数据 数据对应 综合分析 工作量 标注 智能 申请 | ||
本申请实施例提供了一种企业行业分类方法及其装置,其中方法包括获取企业的多种基础数据,并从中选取数据以建立与选取的数据对应的数据模型;根据所述数据模型得到所述企业的行业预测分类;将多个所述企业的行业预测分类综合分析得到所述企业的行业最终分类;可以自动为企业行业进行分类,极大的降低了人工进行行业标注的工作量,并且通过智能的分类方法提高了行业分类的准确性。
技术领域
本申请涉及互联网技术领域,尤其涉及一种企业行业分类的方法及其装置。
背景技术
近年来随着我国市场经济的繁荣,企业征信作为社会信用体系的重要组成部分,在完善市场体系、维护市场秩序、促进市场经济发展等方面发挥着重要作用。基于征信业务的需要,我们需要对企业的行业进行精准的分类。
税务登记信息中的企业行业分类是公司在税务登记之初设定的,人为误差比较大,且与企业真实的行业分类存在较大差异,所以需要再对企业的行业进行准确的分类。另外包括税务大数据和企业经营业务等在内的企业的多种基础数据有很大的分析价值,所以在对企业的行业进行分类时可以根据这些基础数据对企业的行业进行精准的分类。
现有技术中基于企业的多种基础数据,例如企业的经营业务和税务大数据等数据对企业的行业进行分类时,主要使用的仍然是传统的方法,采用人工统计分析对企业的行业进行分类,需要消耗大量的人力物力,工作量繁重,工作效率低;另外,现有技术中对企业的行业进行分类时,基本只单方面参考一种数据,例如根据企业名称数据对企业的行业进行分类,使得分类结果准确性较低,可信度不高。因此,目前亟需一种通过对大数据分析和人工智能的方法对企业的行业进行高效准确智能分类的方法。
发明内容
有鉴于此,本申请的主要目的在于提供一种企业行业分类方法及其装置,以解决现有技术中存在的技术问题。
第一方面,本申请实施例提供了一种企业行业分类方法,包括:
获取企业的多种基础数据,并从中选取数据以建立与选取的数据对应的数据模型;
根据所述数据模型得到所述企业的行业预测分类;
将多个所述企业的行业预测分类综合分析得到所述企业的行业最终分类。
可选地,在本申请一实施例中,选取数据之后,建立与选取的数据对应的数据模型之前,还包括对所述选取的数据进行预处理。
可选地,在本申请一实施例中,对所述选取的数据进行预处理包括后述处理中的至少一种,使用分词工具对数据进行分词处理,删除所述选取的数据中的重复数据,平滑噪声数据。
可选地,在本申请一实施例中,所述多种基础数据包括所述企业名称数据,经营范围数据,主营商品数据、上游企业代码数据和下游企业代码数据中的至少一种。
可选地,在本申请一实施例中,所述从中选取数据以建立与选取的数据对应的数据模型,包括,从所述多种基础数据中选取一种数据或者多种数据,对所述选取的数据进行向量化处理,根据设定的第一算法,建立对应的数据模型。
可选地,在本申请一实施例中,所述设定的第一算法包括卷积神经网络方法,MLPC方法和Logistic回归方法中的至少一种。
可选地,在本申请一实施例中,所述将多个所述企业的行业预测分类综合分析得到所述企业的行业最终分类包括,使用设定的第二算法,对多个所述企业的行业预测分类综合分析,得到所述企业的行业最终分类。
可选地,在本申请一实施例中,所述根据所述数据模型得到所述企业的行业预测分类之前,还包括,从数据库中随机提取设定比例的所述基础数据,所述基础数据的种类与建立所述数据模型的种类相对应,通过对提取的数据进行分析,得到企业的行业准确分类,所述数据模型对所述行业准确分类进行学习。
第二方面,本申请提供了一种企业行业分类装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于爱信诺征信有限公司;航天信息股份有限公司,未经爱信诺征信有限公司;航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811237531.7/2.html,转载请声明来源钻瓜专利网。