[发明专利]分析新增企业与区域经济活跃度关联性的数据挖掘方法在审
申请号: | 201710426592.7 | 申请日: | 2017-06-08 |
公开(公告)号: | CN107085621A | 公开(公告)日: | 2017-08-22 |
发明(设计)人: | 胡夏禹;施阳;刘培彬;陈建明;殷姚吉 | 申请(专利权)人: | 苏州朗动网络科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/06 |
代理公司: | 江苏圣典律师事务所32237 | 代理人: | 王玉国 |
地址: | 215021 江苏省苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分析 新增 企业 区域经济 活跃 关联性 数据 挖掘 方法 | ||
1.分析新增企业与区域经济活跃度关联性的数据挖掘方法,其特征在于包含以下步骤:
(一)数据收集,采集某年地区注册企业的注册资金数据、注册企业的数量数据、以及该地区该年份的GDP数据和新增就业情况数据,每一个地区作为一个数据对象;
(二)数据预处理,对数据进行预处理,使数据为平滑数据;
(三)采用K-means算法进行聚类分析;
(四)根据聚类将数据集分为k个类,按照所给企业数据对各个地方的经济进行预测最终结果。
2.根据权利要求1所述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其特征在于:步骤(三)包括以下步骤:
1)确定聚类的分组组数k的值和结束条件;
2)确定初始化聚类的中心,从数据中选取k个数据对象作为k个组的初始聚类中心;
3)进行初始分组,计算数据集中的每个数据对象到k个聚类中心点的距离,将该数据对象分到距离最小的类中;
4)更新聚类中心,将每个类中所有数据对象的平均值作为该类新的聚类中心;
5)检查是否满足结束条件,若满足则完成聚类,否则重复步骤3)~5),直至达到结束条件为止。
3.根据权利要求2所述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其特征在于:步骤1)中,结束条件为迭代次数达到一个设定的值,或者误差小于给定的阈值。
4.根据权利要求3所述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其特征在于:迭代次数达到1000次,或者聚类的中心不再改变。
5.根据权利要求2所述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其特征在于:步骤2)中,在确定初始聚类中心时,选取区别较大的数据对象。
6.根据权利要求2所述的分析新增企业与区域经济活跃度关联性的数据挖掘方法,其特征在于:步骤3)中,所述距离为欧几里得距离,欧几里得距离为:
其中,Rin是第i个数据对象的第n维数据,Rjn是第j个聚类中心的第n维数据,其中(j∈[1,k.])n代表一个数据对象当前所在维度,m是数据对象的维数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州朗动网络科技有限公司,未经苏州朗动网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710426592.7/1.html,转载请声明来源钻瓜专利网。