[发明专利]一种基于关键词共现的管廊故障分析方法有效
申请号: | 201910323713.4 | 申请日: | 2019-04-22 |
公开(公告)号: | CN110059319B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 孙华;华罗懿;蒋峥嵘;唐聪;金鸣;朱统权;陆理平 | 申请(专利权)人: | 上海化学工业区公共管廊有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/247;G06F40/242;G06F40/216;G06F16/34 |
代理公司: | 上海湾谷知识产权代理事务所(普通合伙) 31289 | 代理人: | 李晓星 |
地址: | 201507 上海市奉贤区化学*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键词 故障 分析 方法 | ||
1.一种基于关键词共现的管廊故障分析方法,其特征在于,所述管廊故障分析方法包括以下步骤:
步骤一:构建以通用词典为基础并涵盖管廊行业专有名词及专业术语的自定义词典;
步骤二:在得到故障信息后,对该故障信息进行故障信息预处理,所述故障信息预处理包括:
S2.1:故障信息去重:若所述故障信息中包含中文信息和英文信息,则将中文信息和英文信息进行比对去重,并对去重后的故障信息进行记录;
S2.2:生成词语集合:在所述自定义词典中,对S2.1中记录的去重后的故障信息利用分词算法进行分词并去除停用词,将分词并去除停用词后的故障信息生成词语集合;
步骤三:在得到所述词语集合后,针对该词语集合进行关键词选取,所述关键词选取包括:
S3.1:词频统计:针对S2.2中生成的词语集合,统计该词语集合中的每个词语及其词频;
S3.2:同义词合并:针对S3.1中的词语集合中的词语及其词频进行同义词合并,并对合并的同义词的词频进行相加;
S3.3:关键词选取:在S3.2中的经过同义词合并后的词语集合中选取词频排名前M的词语作为关键词,其中M为正整数且M小于或者等于该关键词的数量;
S3.4:关键词词云可视化:针对S3.3选出的关键词进行词云可视化;
步骤四:在对关键词进行词云可视化后,形成关键词共现矩阵并将该关键词共现矩阵可视化,包括:
S4.1:初始化共现矩阵:用N表示在S3.3中选择的关键词的数量,构建(N+1)*(N+1)的关键词共现矩阵,并将该关键词共现矩阵的首行和首列初始化为S3.3中选取的关键词;
S4.2:关键词共现频次统计:将S4.1中的关键词共现矩阵中首行的每个关键词分别与首列的每个关键词进行配对,形成关键词对,在S3.2中的经过同义词合并后的词语集合中统计所述关键词对的出现频次,并将该出现频次一一对应地统计入S4.1中的关键词共现矩阵中;
S4.3:关键词共现矩阵可视化:将S4.2中统计完关键词对出现频次的关键词共现矩阵进行可视化;所述关键词共现矩阵可视化的方式为形成关键词共现网络;所述关键词共现网络包括若干节点,每个所述节点分别代表一个S3.3中选取的关键词,各个所述节点间通过无向边进行连接以表达S4.2中的关键词对间的关系,所述无向边的颜色深浅及粗细与该关键词对的出现频次成正比;每个所述节点的大小与该节点的节点度成正比;
步骤五:最终根据所述节点的大小和/或所述无向边的颜色深浅及粗细对管廊故障进行逐一判定排查。
2.如权利要求1所述的一种基于关键词共现的管廊故障分析方法,其特征在于,所述S3.4中进行关键词词云可视化时,关键词的大小与该关键词的词频成正比。
3.如权利要求2所述的一种基于关键词共现的管廊故障分析方法,其特征在于,针对所述关键词共现网络还将通过图布局算法进行布局优化。
4.如权利要求3所述的一种基于关键词共现的管廊故障分析方法,其特征在于,所述图布局算法为力导向算法。
5.如权利要求4所述的一种基于关键词共现的管廊故障分析方法,其特征在于,所述力导向算法为Fruchterman-Reingold算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海化学工业区公共管廊有限公司,未经上海化学工业区公共管廊有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910323713.4/1.html,转载请声明来源钻瓜专利网。