[发明专利]分析企业数据与区域经济繁荣度关联性的数据挖掘方法在审
申请号: | 201910220103.1 | 申请日: | 2019-03-22 |
公开(公告)号: | CN109960716A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 青岛格兰德信用管理咨询有限公司 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06Q10/06;G06Q30/02 |
代理公司: | 青岛华慧泽专利代理事务所(普通合伙) 37247 | 代理人: | 李新欣 |
地址: | 266071 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于区域营销的数据挖掘技术领域,具体涉及分析企业数据与区域经济繁荣度关联性的数据挖掘方法,所述方法包括:数据维度的确定、样本数据选择、数据归一化、样本数据标注、支持向量机训练模型、模型部署以及数据可视化步骤;其中,数据维度的确定的步骤确定的数据维度为半径300米内企业注册资本的均值以及半径300米内企业注册资本的总和;根据选择的区域经济繁荣度相关性强的企业维度,建立基于企业数据的区域经济繁荣度的多分类模型,并且能够实现数据可视化,将分类结果用不同颜色在地图上标识出来;便于销售人员掌握区域内企业的分布情况以及了解某一片区域的整体情况。 | ||
搜索关键词: | 区域经济 企业数据 数据维度 数据可视化 数据挖掘 样本数据 注册资本 关联性 支持向量机训练 数据挖掘技术 多分类模型 数据归一化 步骤确定 分类结果 维度 标注 分析 营销 部署 销售 | ||
【主权项】:
1.分析企业数据与区域经济繁荣度关联性的数据挖掘方法,其特征在于,所述方法包括:数据维度的确定:确定用于计算区域经济繁荣度的数据维度为半径300米内企业注册资本的总和、半径300米内企业数量的总和;样本数据选择:以城区常住人口为统计口径,将全国所有城市分为5个等级:在每个等级的城市中随机抽样至少100000条数据作为样本数据;数据归一化:计算样本数据中半径300米内企业注册资本的总和、半径300米内企业数量的总和的均值和方差,进行归一化处理;样本数据标注:分别计算得出数据归一化步骤中两个归一化指标的0.15分位数、0.3分位数、0.5分位数、0.7分位数、0.85分位数;同时满足两个指标0.15分位数上下浮动0.0002的半径300米的区域标记为5、同时满足两个指标0.3分位数上下浮动0.0002的半径300米的区域标记为4、同时满足两个指标0.5分位数上下浮动0.0002的半径300米的区域标记为3、同时满足两个指标0.7分位数上下浮动0.0002的半径300米的区域标记为2、同时满足两个指标0.85分位数上下浮动0.0002的半径300米的区域标记为1;支持向量机训练模型:将每个等级的样本数据和所述样本数据标注的标记结果分成两个部分:训练集、测试集;每个等级单独用支持向量机多分类算法训练模型,得出区域经济繁荣度结果;模型部署:在阿里云服务器上起一个服务,通过http请求,将每个企业半径300米内企业注册资本的总和、半径300米内企业数量的总和作为请求参数,获得返回结果为1‑5,将结果数据保存在mysql数据库中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛格兰德信用管理咨询有限公司,未经青岛格兰德信用管理咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910220103.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种城市建筑物数据更新方法
- 下一篇:室内导航路网地图模型数据组织方法及系统