[发明专利]一种基于聚类随机森林的城市创新力评价方法及系统在审
申请号: | 201910211169.4 | 申请日: | 2019-03-20 |
公开(公告)号: | CN109902970A | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 徐展彧 | 申请(专利权)人: | 山东浪潮云信息技术有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/26 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 创新力 随机森林 聚类 特征评价 大数据 机器学习领域 互联网数据 传统数据 二级指标 评价维度 评价系统 评价指标 数据反馈 爆炸式 去除 权重 狭窄 渠道 人口 分析 | ||
1.一种基于聚类随机森林的城市创新力评价方法,其特征在于,该方法的具体步骤如下:
S1、确定参与创新力评价的城市,针对创新对互联网平台数据进行全量数据采集的规划和收集工作,将通过互联网平台采集的与创新相关的数据作为初始数据源,得到创新力二级特征评价指标;
S2、整理清洗创新力二级特征评价指标的初始数据源并进行归纳分析,得到二级指标基础上的城市创新力多个评价维度作为一级评价指标;
S3、计算不同城市对应的调整因子,将得到的城市调整因子乘以原始的创新力二级特征评价指标,得到去除人口影响后的创新力二级特征评价新指标;
S4、对参与创新力评价城市使用聚类分析确定该城市所属类别,再基于随机森林算法以聚类结果为导向进行分类,得到二级指标权重;
S5、将各城市创新力二级特征评价新指标乘以对应二级指标权重求得城市创新力总得分;
S6、将各城市的创新力总得分投映到a分至100分这个区间内,得到各城市创新力最终得分。
2.根据权利要求1所述的基于聚类随机森林的城市创新力评价方法,其特征在于,所述步骤S1中互联网平台数据是指网络公开可查的按城市统计的百度指数数据、投融资平台各城市创业项目投融资数据、招聘网站简历与职位发布数据、电影票房数据、各城市房价数据以及大众点评数据。
3.根据权利要求1或2所述的基于聚类随机森林的城市创新力评价方法,其特征在于,所述步骤S2中城市创新力包括六个一级指标,六个一级指标分别是新兴概念关注度、创新人才吸引力、资本驱动力、创新生活圈、创业热度以及创新支撑力。
4.根据权利要求3所述的基于聚类随机森林的城市创新力评价方法,其特征在于,所述新兴概念关注度是指采集涵盖节能环保、新一代信息技术、生物、高端装备制造、新能源、新材料、新能源汽车七大新兴产业的相关概念的互联网搜索热度数据,分析各地市网民对各新兴产业的关注情况差异,得出网民对新兴概念的关注数据;通过在新闻科技类网站查找对应类目下的文章,对相关文章进行分词以及提取关键词以及搜索相应关键词对应的各城市百度指数数据作为新兴概念关注度的二级指标;
创新人才吸引力是通过采集大型互联网招聘平台上分行业、分薪资水平以及分学历的简历和人才数量数据,对各城市的人才薪资结构、行业结构、薪资结构以及活跃度和供需关系进行分析和评价,实现创新人才相关分析和评价;
资本驱动力是通过采集来自创业投融资平台的初创企业获得投资数据,实现对当地资本对创业创新的驱动力评价;
创业热度是通过采集创业相关文章,对文章进行分词、提取关键词以及搜索相应关键词对应的各城市百度指数数据,实现对当地创业的关注度进行评价;
创新生活圈是通过采集电影、饮食及娱乐网站的消费数据,实现对当地创新生活服务实现评价;
创新支撑力是从采集各城市支柱企业数量、展览教育机构数量以及高校数量的创新支撑硬件基础设施的发达程度数据,对当地的创新基础支撑力实现评价。
5.根据权利要求1所述的基于聚类随机森林的城市创新力评价方法,其特征在于,所述步骤S3中计算不同城市对应的调整因子的具体步骤如下:
S301、以各城市人口基数为底,乘以权威机构公布的各城市网民占比,得到城市网民数量;
S302、取所有调查城市网民数量中位数作为基点;
S303、将各个城市的网民数量分别与中位数进行线性调整,函数关系为:
其中,yi是不同城市对应的调整因子;xi是各城市网民数量;median是城市网民中位数;
S304、将得到的城市调整因子乘以创新力二级特征评价指标,得到去除人口影响后的创新力二级特征评价新指标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮云信息技术有限公司,未经山东浪潮云信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910211169.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理