[发明专利]一种基于聚类与综合评价的产业领袖识别方法在审
申请号: | 202110092184.9 | 申请日: | 2021-01-23 |
公开(公告)号: | CN112785156A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 罗家德;杨虎 | 申请(专利权)人: | 罗家德;杨虎 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62;G06F16/951;G06F16/21;G06F16/23 |
代理公司: | 江苏海越律师事务所 32402 | 代理人: | 唐小红 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 综合 评价 产业 领袖 识别 方法 | ||
1.一种基于聚类与综合评价的产业领袖识别方法,其特征在于,包括数据收集模块、指标体系构建模块、聚类与排序模块、结果输出模块,具体流程如下:
1)数据收集模块
1-1)数据爬取
首先,选取待评价的行业,确定信息来源,从信息来源网页中爬取企业信息,包括两类:一是企业基本信息,二是企业的合作事件,每一条合作事件都代表在某个时间节点,某个企业与其他企业的合作情况;
1-2)数据库构建
为了保证数据的一致性和有效性,对爬取到的原始数据进行汇总、重复值处理、缺失值处理、数据类型统一化等操作,并将处理好的数据导入数据库,最终建立企业基本信息和合作事件数据库;
1-3)数据更新
数据更新模块将实时采集数据,旨在在企业信息发生改变时,更新企业信息,同时实时更新行业中新成立的企业列表;同时,系统将同步更新企业合作信息,一旦企业之间有新的合作关系,将触发数据爬取模块工作,实时获取相关数据并更新数据库;
2)评价指标构建模块
评级指标构建模块将根据企业基本信息和合作事件数据库,构建企业基本信息、企业合作行为和企业合作网络三类指标;其中,合作的企业数量NoC,它表明了企业是否有足够的资产和资源进行合作;如果企业的NoC较高,说明其资产更多,整合资源能力强,能进行较大规模的交易;同样,包括企业的规模和经验的指标还有:合作总额TNC,企业合作涉及的行业数量NoI,国家数量NoCoun、省份数量NoPR,;
同时,通过企业之间的合作关系,提取刻画企业社会关系的指标,用来刻画企业在产业网络中的地位,这些指标包括:度中心度DC、接近中心度CC、核心度KC、特征向量中心度ECHITs值HITs和PageRank指标PR;
3)聚类和排名模块
第一步,聚类、估计指标权重
采用加权k-means聚类算法来计算指标的权重,根据企业的规模、经验指标和合作网络指标实现企业的分类,在分类的过程中估计每个指标的重要性,从而确定哪些指标对聚类划分更重要;
第二步,计算综合得分;
第三步:对企业进行聚类并依据综合得分排序,结果输出。
2.如权利要求1所述的产业领袖识别方法,其特征在于,所述2)评价指标构建模块中的三类指标基于产业网络的以下定义:
定义1.无向合作网络Gu=(vu,Eu),vu={v1,v2,...,vn}是节点的集合,表示一组企业,是企业之间的连边的集合,表示企业之间的合作关系;对于每条连边eij∈Eu,满足条件:EU是对称矩阵,即eij=eji,其中
设ti和tj分别为第i家企业和第j家企业开展合作的时间戳,如果第i家企业开始合作早于第j家企业,则Iij(ti≤tj)=1;如果合作发生在同一时间,则:Iij(ti=tj)=Iji(ti=tj)1;
定义2.有向合作网络:GD=(vD,ED),ED是非对称矩阵,即对于i,j=1,2,…,n,eij可能不等于eji,当且仅当第i家企业和第j家在同一地点和同一时间开展合作,则eij=eji;
根据无向图和有向图的定义,计算企业的中心度指标,其中,中心度DC、接近中心度CC、核心度KC、特征向量中心度EC和HITs值是依据无向图计算得到的,而PageRank指标PR则是基于有向图计算得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗家德;杨虎,未经罗家德;杨虎许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110092184.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理