[发明专利]工单数据处理方法、装置、服务器及可读存储介质在审
申请号: | 202111446961.1 | 申请日: | 2021-11-30 |
公开(公告)号: | CN114266242A | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 闫慎悦;戚勇;王铮;王金钗;李铁军 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/289;G06K9/62;G06F16/33 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 服务器 可读 存储 介质 | ||
本申请提供一种工单数据处理方法、装置、服务器及可读存储介质。该方法包括:服务器可以以固定周期从工单管理系统中获取在当前周期内生成的工单数据集合。服务器可以获取每一工单数据对应的关键词集合。服务器可以根据所述工单数据、所述工单数据的所述关键词集合和所述业务词库,确定所述关键词集合中每一述关键词的目标权重。服务器可以根据该关键词集合和每一关键词的权重,确定该工单向量的工单向量集合。服务器可以将这些工单向量与聚类中心集合中的聚类中心进行匹配,确定这些工单数据是否属于该聚类中心集合中的类别。本申请的方法,提高了工单数据的分类准确率,提高工单数据的处理效率。
技术领域
本申请涉及计算机领域,尤其涉及一种工单数据处理方法、装置、服务器及可读存储介质。
背景技术
在通信领域中,工单通常应用于设备的维修或者维护。面对这些工单,除了需要合理派发,对这些工单进行复盘也是极其重要的。
在工单复盘过程中,对工单进行分类是其中重要的一环。现有技术中,工单管理系统通常需要人工完成对工单数据的分类和统计。
显然,现在有技术存在工单数据的处理效率低的问题。
发明内容
本申请提供一种工单数据处理方法、装置、服务器及可读存储介质,用以解决现在有技术中工单数据的处理效率低的问题。
第一方面,本申请提供一种工单数据处理方法,包括:
获取工单数据集合,并根据业务词库和停用词库对所述工单数据集合中的每一工单数据进行分词,得到所述工单数据的关键词集合;
根据所述工单数据、所述工单数据的所述关键词集合和所述业务词库,确定所述关键词集合中每一述关键词的目标权重;
根据所述工单数据的所述关键词集合和所述关键词集合中每一所述关键词的目标权重,确定所述工单数据的工单向量;
使用预设聚类算法和聚类中心集合,对所述工单向量进行聚类分析,确定所述工单向量对应的工单数据的所属类别,所述聚类中心集合中包括至少一个聚类中心,每一所述聚类中心对应于一个类别。
可选地,所述对所述工单数据进行分词,得到所述工单数据的多个关键词,包括:
使用业务词库对所述工单数据进行分词,得到所述工单数据的关键词集合;
使用停用词库对所述工单数据的关键词集合进行数据清洗。
可选地,所述根据所述工单数据、所述工单数据的所述关键词和所述业务词库,确定每一所述关键词的目标权重,包括:
根据每一所述关键词在所述工单数据中的词频和逆向文件频率,确定每一所述关键词的第一权重;
根据每一所述关键词与所述业务词库中业务词的匹配程度,确定每一所述关键词的第二权重;
根据每一所述关键词在所述工单数据中的位置,确定每一所述关键词的第三权重;
根据预设系数、所述第一权重、所述第二权重和所述第三权重,确定每一所述关键词的目标权重。
可选地,所述方法,还包括:
当所述工单向量不属于所述聚类中心集合中任一类别时,计算所述工单向量所属类别的聚类中心,并将所述聚类中心添加到所述聚类中心集合中。
可选地,所述方法,还包括:
当所述工单是数据的一关键词不在业务词库中时,将所述关键词作为新的业务词添加到所述业务词库中。
可选地,所述方法,还包括:
根据业务词库中每一业务词的出现频率,确定所述业务词的活跃值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111446961.1/2.html,转载请声明来源钻瓜专利网。