[发明专利]一种园区企业分类方法、系统、智能终端及存储介质在审

专利信息
申请号: 202110756765.8 申请日: 2021-07-05
公开(公告)号: CN113342984A 公开(公告)日: 2021-09-03
发明(设计)人: 杨毅;吴孝林 申请(专利权)人: 深圳云谷星辰信息技术有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F40/30;G06Q10/06
代理公司: 暂无信息 代理人: 暂无信息
地址: 518116 广东省深圳市龙岗区坂田*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 企业 分类 方法 系统 智能 终端 存储 介质
【权利要求书】:

1.一种园区企业分类方法,其特征在于,包括如下步骤:

S1:提取园区的各企业中经营信息的关键词,依照关键词对企业进行聚类分析,以将园区的各个企业归类至相应的行业;

S2:获取企业资讯,抓取所述企业资讯中的多个高频词,对多个所述高频词进行融合处理生成特征词集;

S3:对所述特征词集进行分析企业之间的相似度,并根据企业之间的相似度进行聚类分析,形成多个产业类;

S4:依照行业和产业类对企业进行分类汇总,形成多个产业类群。

2.根据权利要求1所述的园区企业分类方法,其特征在于,步骤S1包括:

S11:获取企业的经营信息,并对所述经营信息进行语义分析,提取多个信息片段;

S12:对多个所述信息片段进行处理,构建信息大纲;

S13:提取筛查所述信息大纲中超过第一预设阀值的词组,并将所述词组设置为关键词。

3.根据权利要求2所述的园区企业分类方法,其特征在于,在步骤S12包括对多个所述信息片段的处理方法至少包括以下一种:清洗、剔除、合并、重塑、标准化。

4.根据权利要求1所述的园区企业分类方法,其特征在于,步骤S2包括:

S21:对资讯进行筛查去重处理,抓取原始资讯;

S22:提取原识资讯中的多个高频词;

S23:对多个高频词进行语义分析,并使得所有词义相同或者相近的高频词均用一个词进行表示,形成特征词集合。

5.根据权利要求4所述的园区企业分类方法,其特征在于,步骤S21具体为:对资讯进行语义分析,若任意两篇资讯的语义分析结果相似度大于第一预设阀值,则将发布时间较早的资讯作为原始资讯,并删除另一篇资讯。

6.根据权利要求1所述的园区企业分类方法,其特征在于,步骤S3包括:

S31:根据特征值的类别信息、词频计算特征词的特征值;

S32:依照特征值为企业建立向量模型;

S33:根据向量模型的模型之间的余弦相似度确定企业之间的行业相似度。

7.一种园区企业分类系统,其特征在于,包括:

信息提取分析模块,提取园区的各企业中经营信息的关键词,依照关键词对企业进行聚类分析,以将园区的各个企业归类至相应的行业;

特征词提取处理模块,获取企业资讯,抓取企业资讯中的多个高频词,对多个高频词进行融合处理生成特征词集;

聚类分析模块,对所述特征词集进行分析企业之间的相似度,并根据企业之间的相似度进行聚类分析,形成多个产业类;

数据分析汇总模块,依照行业和产业类对企业进行分类汇总,形成多个产业类群。

8.一种智能终端,其特征在于,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如权利要求1至6中任一种方法的计算机程序。

9.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1至6中任一种方法的计算机程序。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳云谷星辰信息技术有限公司,未经深圳云谷星辰信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110756765.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top