[发明专利]一种针对产业整合对标管理工业大数据计算分类方法在审
申请号: | 202011139332.X | 申请日: | 2020-10-22 |
公开(公告)号: | CN112257780A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 王荣浩;王敏;纪慧;米韵 | 申请(专利权)人: | 苏州华检工标信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 武汉智新达知识产权代理事务所(特殊普通合伙) 42272 | 代理人: | 陈文森 |
地址: | 215400 江苏省苏州市太*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 产业 整合 理工 业大 数据 计算 分类 方法 | ||
1.一种针对产业整合对标管理工业大数据计算分类方法,其特征在于,包括以下步骤:
1)对有类标和无类标的数据分别进行预处理,得到对应的分类数据集A;
2)将步骤1)中的分类数据集进行特征选择,并得到特征选择后的分类数据集An;
3)将步骤2)中的分类数据集An按照向量模型进行计算,从而将分类数据集An分别转化为对应的一维向量;
4)重复步骤1)、2)和3),并得到分类模型;
5)将数据S导入到分类模型中,并对数据S进行分词得到数据S1;
6)分类模型对步骤5)中的数据S1建立向量模型,并提取数据S1特征;
7)在基于步骤6)中特征数据S1与其所有相关概率的前提下,判断其是否完成计算;
8)若完成计算,则将数据S1分到与其最大相关类别,否则将数据S1再次进行计算;
9)判断分类是否完成,完成分类,保存分类数据并进行上传,否则重新对数据S1进行建立向量模型。
2.根据权利要求1所述的一种针对产业整合对标管理工业大数据计算分类方法,其特征在于:所述步骤3)中向量模型是将分类数据集An设置为一个由n维特征组成的向量,所述向量模型中每一个特征均为一个。
3.根据权利要求1所述的一种针对产业整合对标管理工业大数据计算分类方法,其特征在于:所述步骤3)中向量模型的计算按照TFIDF加权模型进行计算。
4.根据权利要求1所述的一种针对产业整合对标管理工业大数据计算分类方法,其特征在于:所述数据分类包括去除分词与停用词,且统计单个文件词频。
5.根据权利要求1所述的一种针对产业整合对标管理工业大数据计算分类方法,其特征在于:所述步骤4)中将有类标的一维向量按照贝叶斯算法计算,得到每个类别的先验概率和每个词条属于每个类别的先验概率。
6.根据权利要求5所述的一种针对产业整合对标管理工业大数据计算分类方法,其特征在于:所述先验概率按照贝叶斯算法计算出无类标的一维向量中每个词条可能属于的类别,并将结果加入到之前有类标的新的一维向量中。
7.根据权利要求6所述的一种针对产业整合对标管理工业大数据计算分类方法,其特征在于:所述新的一维向量采用最大似然估计法,得到每个类别的先验概率和每个词条属于每个类别的先验概率。
8.根据权利要求5所述的一种针对产业整合对标管理工业大数据计算分类方法,其特征在于:所述先验概率,按照贝叶斯算法计算,更新一维向量中每个词条可能属于的类别。
9.根据权利要求1所述的一种针对产业整合对标管理工业大数据计算分类方法,其特征在于:所述步骤4)中,重复步骤1)、2)和3),并直到一维向量中每个类别的先验概率和每个词条属于每个类别的先验概率收敛,从而得到分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州华检工标信息技术有限公司,未经苏州华检工标信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011139332.X/1.html,转载请声明来源钻瓜专利网。