[发明专利]一种终端辅助SWOT指标体系的构建方法有效
申请号: | 201811515374.1 | 申请日: | 2018-12-11 |
公开(公告)号: | CN109657070B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 石进;韩进;金鹏 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/289;G06F40/216 |
代理公司: | 南京中高专利代理有限公司 32333 | 代理人: | 祝进 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 终端 辅助 swot 指标体系 构建 方法 | ||
1.一种终端辅助SWOT指标体系的构建方法,其特征在于,包括:
步骤S100,对文本数据集的关键词提取;
步骤S200,关键词聚类和SWOT指标体系映射;以及
步骤S300,生成指标体系权重建议;
所述步骤S100中对文本数据集的关键词提取的方法包括:
步骤S101,停用词过滤,对采集的文本数据集进行中文分词之后,通过积累挑选形成的停用词表,过滤文本数据中的停用词;
步骤S102,特定词过滤,通过搜索引擎对词进行搜索,对于搜索结果少于阈值的词,判断其为特定词,然后将特定词过滤;
步骤S103,关键词提取,通过改进的TF/IDF算法进行关键词提取;
所述改进的TF/IDF算法为:
式1
式2 Wn={W|TF/IDF(wn)>η};
式3 W=∪Wn;
式4
式中,TF/IDF(wn)为标号为n的文本数据中词w的TF/IDF权值;TF(wn)为词w在标号为n的文本数据中出现的频数;N为文本数据集包含的文本数据数;d为包含词w的文本数据数;
所述通过改进的TF/IDF算法进行关键词提取的方法包括:
通过式1计算出文本数据集中每个文本数据中包含的关键词的TF/IDF权值;
根据各文本数据中关键词的TF/IDF权值按大小进行排序;
提取权值大于阈值η的关键词形成标号为n的文本数据的关键词集合Wn,所有文本数据的Wn集合汇总为文本数据集的关键词W集合;
针对W集合中的关键词两两配对,计算比值C;
式4中TFsum(Wa)指某关键词a在W集合中出现的频数累加和,TFsum(Wb)是指某关键词b在W集合中出现的频数累加和,G(Wa)是指该关键词a在搜索引擎中获取的检索页面结果数;G(Wb)是指该关键词b在搜索引擎中获取的检索页面结果数;比值C为一对关键词a和b的TFsum值与G值的乘积的比值,并且按比值的结果对W集合中的关键词排序,并按顺序显示以对关键词加以修正;
所述步骤S200,关键词聚类和SWOT指标体系映射的方法包括:
步骤S201,依据中国分类主题词表,实现对关键词的初次分类,对照中国分类主题词表,将当前文本数据集中提取出的关键词进行分类,建立初始的关键词分类结构;
步骤S202,针对初步分类后,剩余的在中国分类主题词表中无法对应分类的关键词,依据词的近义程度作为词与词的距离度量,采用K_MEANS聚类方法对剩余关键词进行聚类;
步骤S203,在终端辅助聚类完成之后,再将聚类后的关键词分类展现并修正;
步骤S204,经过对关键词聚类的重复迭代以及对聚类后的关键词分类修正后,根据聚类后的词类的分类信息,将词类映射成对应地指标,即
建立SWOT分析的指标体系。
2.如权利要求1所述的构建方法,其特征在于,
所述步骤S300中生成指标体系权重建议的方法包括:选择影响指标体系权重判断的因素;
所述影响指标体系权重判断的因素包括:
词类包含的关键词的词量:通过分析关键词聚类过程中生成的各词类所包含的关键词数量,以判断该词类所映射生成指标权重,即关键词数量越多的词类其对应的指标权重越大;
词类包含的关键词的词频:为词类中包含的所有关键词在文本数据集中出现的频次累计和;
词类包含的关键词的时效性:为一个词类包含的关键词在时间维度上的词频统计显示出该关键词在时间维度上被关注的程度。
3.如权利要求2所述的构建方法,其特征在于,
所述步骤S300中生成指标体系权重建议的方法还包括:基于影响指标体系权重判断的因素构建指标体系权重建议的生成公式,即
式中,R(W)为一个词类对应的指标权重建议;i从1到k为该词类中包含的关键词数,依次对该类中所有关键词进行计算;j从1到d为包括该词类中某个词w的文本数据,依次对包含该词w的所有文本数据进行计算;遍历包含词w的文本数据,分别计算第j个包含词w的时间衰减函数;TF(wj)为词w在文本数据j中出现的频次;e-μ(t-tc)为时间衰减函数;μ为衰减常数;t为该文本数据出现的时间;tc为当前时刻;
计算各词类的R(W)权重建议值之后生成指标权重建议。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811515374.1/1.html,转载请声明来源钻瓜专利网。