[发明专利]分析新增企业与区域经济活跃度关联性的数据挖掘方法在审
申请号: | 201710426592.7 | 申请日: | 2017-06-08 |
公开(公告)号: | CN107085621A | 公开(公告)日: | 2017-08-22 |
发明(设计)人: | 胡夏禹;施阳;刘培彬;陈建明;殷姚吉 | 申请(专利权)人: | 苏州朗动网络科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/06 |
代理公司: | 江苏圣典律师事务所32237 | 代理人: | 王玉国 |
地址: | 215021 江苏省苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分析 新增 企业 区域经济 活跃 关联性 数据 挖掘 方法 | ||
技术领域
本发明涉及一种用于分析新增企业与区域经济活跃度关联性的数据挖掘方法。
背景技术
近些年来,随着国家经济飞速发展,以及政府大力支持自主创业,新增的企业也越来越多。但是新增的企业在地区上也存在很大的差异性,如北上广深,这些经济发达的地区,每年新增的企业无论是数量还是规模上都远远超过其他地区。
如何从新注册的企业入手,通过分析各个地区注册企业的信息,分析地区新增企业的数量、规模与该地区经济活跃度之间存在的关系。
发明内容
本发明的目的是克服现有技术存在的不足,提供一种用于分析新增企业与区域经济活跃度关联性的数据挖掘方法。
本发明的目的通过以下技术方案来实现:
分析新增企业与区域经济活跃度关联性的数据挖掘方法,特点是包含以下步骤:
(一)数据收集,采集某年地区注册企业的注册资金数据、注册企业的数量数据、以及该地区该年份的GDP数据和新增就业情况数据,每一个地区作为一个数据对象;
(二)数据预处理,对数据进行预处理,使数据为平滑数据;
(三)采用K-means算法进行聚类分析;
(四)根据聚类将数据集分为k个类,按照所给企业数据对各个地方的经济进行预测最终结果。
进一步地,上述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其中,步骤(三)包括以下步骤:
1)确定聚类的分组组数k的值和结束条件;
2)确定初始化聚类的中心,从数据中选取k个数据对象作为k个组的初始聚类中心;
3)进行初始分组,计算数据集中的每个数据对象到k个聚类中心点的距离,将该数据对象分到距离最小的类中;
4)更新聚类中心,将每个类中所有数据对象的平均值作为该类新的聚类中心;
5)检查是否满足结束条件,若满足则完成聚类,否则重复步骤3)~5),直至达到结束条件为止。
更进一步地,上述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其中,步骤1)中,结束条件为迭代次数达到一个设定的值,或者误差小于给定的阈值。
更进一步地,上述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其中,迭代次数达到1000次,或者聚类的中心不再改变。
更进一步地,上述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其中,步骤2)中,在确定初始聚类中心时,选取区别较大的数据对象。
更进一步地,上述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其中,步骤3)中,所述距离为欧几里得距离,
欧几里得距离为:
其中,Rin是第i个数据对象的第n维数据,Rjn是第j个聚类中心的第n维数据,其中(j∈[1,k.])n代表一个数据对象当前所在维度,m是数据对象的维数。
更进一步地,上述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其中,步骤(一)中,数据对象组成的数据集表示为P={R1,R2,…,Rm},其中R1,R2,…,Rm为m个数据对象,其中每个数据对象都有n个维度,m个数据对象组成的矩阵为:
更进一步地,上述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其中,步骤(二)中,用分箱法对数据进行预处理,去掉脏数据,确保数据平滑。
再进一步地,上述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其中,将数据按照企业类型分组,每一组都按照企业注册资金进行排序,将每组中最大的和最小的1%的数据删除。
再进一步地,上述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其中,将数据按照企业的注册资金进行分组,每一组按照企业规模进行排序,将每组中最大的和最小的1%的数据删除。
本发明与现有技术相比具有显著的优点和有益效果,具体体现在以下方面:
①通过指定k个初始聚类中心而不是随机选取,消除了随机选取初始聚类中心导致分组的不确定性,有更好的分组效果;
②通过给予不同的数据维度一定的权重值,而不是一视同仁,改进了现有技术中进行分组时不同数据维度相同权重的缺点,更好体现各维度对分组的影响,使分组更加准确;
③加快了算法的收敛程度,能够更快地得到分组结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州朗动网络科技有限公司,未经苏州朗动网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710426592.7/2.html,转载请声明来源钻瓜专利网。