[发明专利]一种园区企业分类方法、系统、智能终端及存储介质在审
申请号: | 202110756765.8 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113342984A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 杨毅;吴孝林 | 申请(专利权)人: | 深圳云谷星辰信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06Q10/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518116 广东省深圳市龙岗区坂田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 企业 分类 方法 系统 智能 终端 存储 介质 | ||
1.一种园区企业分类方法,其特征在于,包括如下步骤:
S1:提取园区的各企业中经营信息的关键词,依照关键词对企业进行聚类分析,以将园区的各个企业归类至相应的行业;
S2:获取企业资讯,抓取所述企业资讯中的多个高频词,对多个所述高频词进行融合处理生成特征词集;
S3:对所述特征词集进行分析企业之间的相似度,并根据企业之间的相似度进行聚类分析,形成多个产业类;
S4:依照行业和产业类对企业进行分类汇总,形成多个产业类群。
2.根据权利要求1所述的园区企业分类方法,其特征在于,步骤S1包括:
S11:获取企业的经营信息,并对所述经营信息进行语义分析,提取多个信息片段;
S12:对多个所述信息片段进行处理,构建信息大纲;
S13:提取筛查所述信息大纲中超过第一预设阀值的词组,并将所述词组设置为关键词。
3.根据权利要求2所述的园区企业分类方法,其特征在于,在步骤S12包括对多个所述信息片段的处理方法至少包括以下一种:清洗、剔除、合并、重塑、标准化。
4.根据权利要求1所述的园区企业分类方法,其特征在于,步骤S2包括:
S21:对资讯进行筛查去重处理,抓取原始资讯;
S22:提取原识资讯中的多个高频词;
S23:对多个高频词进行语义分析,并使得所有词义相同或者相近的高频词均用一个词进行表示,形成特征词集合。
5.根据权利要求4所述的园区企业分类方法,其特征在于,步骤S21具体为:对资讯进行语义分析,若任意两篇资讯的语义分析结果相似度大于第一预设阀值,则将发布时间较早的资讯作为原始资讯,并删除另一篇资讯。
6.根据权利要求1所述的园区企业分类方法,其特征在于,步骤S3包括:
S31:根据特征值的类别信息、词频计算特征词的特征值;
S32:依照特征值为企业建立向量模型;
S33:根据向量模型的模型之间的余弦相似度确定企业之间的行业相似度。
7.一种园区企业分类系统,其特征在于,包括:
信息提取分析模块,提取园区的各企业中经营信息的关键词,依照关键词对企业进行聚类分析,以将园区的各个企业归类至相应的行业;
特征词提取处理模块,获取企业资讯,抓取企业资讯中的多个高频词,对多个高频词进行融合处理生成特征词集;
聚类分析模块,对所述特征词集进行分析企业之间的相似度,并根据企业之间的相似度进行聚类分析,形成多个产业类;
数据分析汇总模块,依照行业和产业类对企业进行分类汇总,形成多个产业类群。
8.一种智能终端,其特征在于,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如权利要求1至6中任一种方法的计算机程序。
9.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1至6中任一种方法的计算机程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳云谷星辰信息技术有限公司,未经深圳云谷星辰信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110756765.8/1.html,转载请声明来源钻瓜专利网。