[发明专利]分析企业数据与区域经济繁荣度关联性的数据挖掘方法在审
申请号: | 201910220103.1 | 申请日: | 2019-03-22 |
公开(公告)号: | CN109960716A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 青岛格兰德信用管理咨询有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06Q10/06;G06Q30/02 |
代理公司: | 青岛华慧泽专利代理事务所(普通合伙) 37247 | 代理人: | 李新欣 |
地址: | 266071 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 区域经济 企业数据 数据维度 数据可视化 数据挖掘 样本数据 注册资本 关联性 支持向量机训练 数据挖掘技术 多分类模型 数据归一化 步骤确定 分类结果 维度 标注 分析 营销 部署 销售 | ||
1.分析企业数据与区域经济繁荣度关联性的数据挖掘方法,其特征在于,所述方法包括:
数据维度的确定:确定用于计算区域经济繁荣度的数据维度为半径300米内企业注册资本的总和、半径300米内企业数量的总和;
样本数据选择:以城区常住人口为统计口径,将全国所有城市分为5个等级:在每个等级的城市中随机抽样至少100000条数据作为样本数据;
数据归一化:计算样本数据中半径300米内企业注册资本的总和、半径300米内企业数量的总和的均值和方差,进行归一化处理;
样本数据标注:分别计算得出数据归一化步骤中两个归一化指标的0.15分位数、0.3分位数、0.5分位数、0.7分位数、0.85分位数;同时满足两个指标0.15分位数上下浮动0.0002的半径300米的区域标记为5、同时满足两个指标0.3分位数上下浮动0.0002的半径300米的区域标记为4、同时满足两个指标0.5分位数上下浮动0.0002的半径300米的区域标记为3、同时满足两个指标0.7分位数上下浮动0.0002的半径300米的区域标记为2、同时满足两个指标0.85分位数上下浮动0.0002的半径300米的区域标记为1;
支持向量机训练模型:将每个等级的样本数据和所述样本数据标注的标记结果分成两个部分:训练集、测试集;每个等级单独用支持向量机多分类算法训练模型,得出区域经济繁荣度结果;
模型部署:在阿里云服务器上起一个服务,通过http请求,将每个企业半径300米内企业注册资本的总和、半径300米内企业数量的总和作为请求参数,获得返回结果为1-5,将结果数据保存在mysql数据库中。
2.根据权利要求1所述分析企业数据与区域经济繁荣度关联性的数据挖掘方法,其特征在于,所述方法还包括数据可视化步骤,具体为:将支持向量机训练模型步骤中的区域经济繁荣度的标记结果在地图上标识出来,并根据标记结果标识不同颜色。
3.根据权利要求1所述分析企业数据与区域经济繁荣度关联性的数据挖掘方法,其特征在于,所述确定用于计算区域经济繁荣度的数据维度为半径300米内企业注册资本的总和、半径300米内企业数量的总和的方法具体为:
根据业务经验给出备选的数据维度,备选的数据维度包括:半径300米内企业注册资本的均值、半径300米内企业注册资本的总和、半径300米内企业数量的总和、半径500米内企业注册资本的均值、半径500米内企业注册资本的总和、半径500米内企业数量的总和、半径1000米内企业注册资本的均值、半径1000米内企业注册资本的总和、半径1000米内企业数量的总和;
选取一测试区域作为测试数据,按所述测试区域内照经济繁荣度将所述测试区域进行人为标记分成5个档次,然后采用Pearson相关性分析方法来计算备选的数据维度与人为标记的不同档次的相关性,根据相关性,选择获得半径300米内企业注册资本的总和、和半径300米内企业数量的总和2个数据维度作为计算区域经济繁荣度的数据维度。
4.根据权利要求1所述分析企业数据与区域经济繁荣度关联性的数据挖掘方法,其特征在于,在样本数据选择的步骤中,每条样本数据均包括对应抽样城市中半径300米内企业注册资本的总和、以及半径300米内企业数量的总和。
5.根据权利要求1所述分析企业数据与区域经济繁荣度关联性的数据挖掘方法,其特征在于,在所述数据归一化的步骤中,采用以下公式计算出归一化以后的指标:
归一化半径300米内企业注册资本的总和=(半径300米内企业注册资本的总和-半径300米内企业注册资本的总和均值)/半径300米内企业注册资本的总和方差;
归一化半径300米内企业数量的总和=(半径300米内企业数量的总和-半径300米内企业数量的总和均值)/半径300米内企业数量的总和方差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛格兰德信用管理咨询有限公司,未经青岛格兰德信用管理咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910220103.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种城市建筑物数据更新方法
- 下一篇:室内导航路网地图模型数据组织方法及系统