[发明专利]一种园区企业分类方法、系统、智能终端及存储介质在审
申请号: | 202110756765.8 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113342984A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 杨毅;吴孝林 | 申请(专利权)人: | 深圳云谷星辰信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06Q10/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518116 广东省深圳市龙岗区坂田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 企业 分类 方法 系统 智能 终端 存储 介质 | ||
本发明涉及一种园区企业分类方法、系统、智能终端及存储介质,其中园区企业分类方法包括提取园区的各企业中经营信息的关键词,依照关键词对企业进行聚类分析,将园区的各个企业归类至相应行业;获取企业资讯并抓取多个高频词,对多个高频词进行融合处理生成特征词集;对特征词集进行分析企业之间的相似度,并根据企业之间的相似度进行聚类分析,形成多个产业类;依照行业和产业类对企业进行分类汇总,形成多个产业类群。本方法能够基于所获取的企业经营信息和企业资讯提取企业特征值采用聚类分析法将园区企业归类中不同的行业和产业类内,并根据行业和产业类这两个维度对园区企业的分类汇总,以实现对园区企业科学分类管治。
技术领域
本发明涉及园区管理技术领域,特别是涉及一种园区企业分类方法、系统、智能终端及存储介质。
背景技术
智慧园区指一般由政府(民营企业与政府合作)规划建设的,供水、供电、供气、通讯、道路、仓储及其它配套设施齐全、布局合理且能够满足从事某种特定行业生产和科学实验需要的标准性建筑物或建筑物群体,“包括工业园区、产业园区、物流园区、都市工业园区、科技园区、创意园区等。”。目前,园区企业的信息主要是按照楼栋牌号人工录入至档案表格中进行存档。这样,当需要了解某种类型的企业时,需要工作人员细读每个档案表格挑选,比较浪费时间和精力,且人工筛选企业容易遗漏,因此很难从整体上有效管理和促进园区的企业。
发明内容
本发明的主要目的是提供一种园区企业分类方法、系统、智能终端及存储介质,该方法能够基于所获取的企业经营信息和企业资讯提取企业特征值采用聚类分析法将园区企业归类中不同的行业和产业类内,并根据行业和产业类这两个维度对园区企业的分类汇总,以实现对园区企业以实现科学分类管治。该技术方案包括如下内容。
一方面,提供了一种园区企业分类方法,包括如下步骤:
S1:提取园区的各企业中经营信息的关键词,依照关键词对企业进行聚类分析,以将园区的各个企业归类至相应的行业;
S2:获取企业资讯,抓取所述企业资讯中的多个高频词,对多个所述高频词进行融合处理生成特征词集;
S3:对所述特征词集进行分析企业之间的相似度,并根据企业之间的相似度进行聚类分析,形成多个产业类;
S4:依照行业和产业类对企业进行分类汇总,形成多个产业类群。
在一种可能实施方式中,步骤S1包括:
S11:获取企业的经营信息,并对所述经营信息进行语义分析,提取多个信息片段;
S12:对多个所述信息片段进行处理,构建信息大纲;
S13:提取筛查所述信息大纲中超过第一预设阀值的词组,并将所述词组设置为关键词。
在一种可能实施方式中,在步骤S12包括对多个所述信息片段的处理方法至少包括以下一种:清洗、剔除、合并、重塑、标准化。
在一种可能实施方式中,步骤S2包括:
S21:对资讯进行筛查去重处理,抓取原始资讯;
S22:提取原识资讯中的多个高频词;
S23:对多个高频词进行语义分析,并使得所有词义相同或者相近的高频词均用一个词进行表示,形成特征词集合。
在一种可能实施方式中,步骤S21具体为:对资讯进行语义分析,若任意两篇资讯的语义分析结果相似度大于第一预设阀值,则将发布时间较早的资讯作为原始资讯,并删除另一篇资讯。
在一种可能实施方式中,步骤S3包括:
S31:根据特征值的类别信息、词频计算特征词的特征值;
S32:依照特征值为企业建立向量模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳云谷星辰信息技术有限公司,未经深圳云谷星辰信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110756765.8/2.html,转载请声明来源钻瓜专利网。