[发明专利]基于工单的热词挖掘、分类和分析的方法和系统有效
申请号: | 202111481594.9 | 申请日: | 2021-11-29 |
公开(公告)号: | CN114510566B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 邬树纯;倪莺;徐喆;张宇扬;傅纲;李权章;杨剑;韩学进 | 申请(专利权)人: | 上海市黄浦区城市运行管理中心(上海市黄浦区城市网格化综合管理中心;上海市黄浦区大数据中心) |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F16/387;G06F40/216;G06F40/289;G06F18/22;G06Q10/10;G06Q50/26 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 顾嘉运 |
地址: | 200020*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 挖掘 分类 分析 方法 系统 | ||
1.一种工单分析的方法,包括:
从用户接收查询请求,所述查询请求可包括指定的要查询的主题类别信息和地理位置信息中的至少一者;
通过分析所述查询请求,从工单数据库中检索出与所述查询请求相关联的工单作为分析结果;以及
将所述分析结果展示给做出请求的所述用户以辅助决策,其中所述展示步骤包括:
通过图形化展示和分析报告展示中的至少一种展示方式来向用户显示分析结果;
其中,所述图形化展示可用于展示各地区同一主题的工单的热度;
其中,所述分析报告展示可用于展示各地区同一主题的整体情况、频发区域,结合历史处理方案指导各地区进行预警及工单处理工作的信息;
其中,所述工单数据库中的所述工单是利用如下步骤生成:
创建主题关键词词袋,包括:
将来自各个数据源的多个工单进行数据整合,包括:
将所述工单进行结构化以生成对应的文本信息;
对所述文本信息进行规范化;
对整合后的工单数据进行全量工单的词频统计及关键词获取,包括:
对所述工单的内容进行分词处理;
统计每个词出现的次数作为词频;以及
按照所述词频排序所述词,并将词频高的词选作为关键词;以及根据获得的所述工单的关键词,创建对应的主题类别和基础主题关键词词袋,所述基础主题关键词词袋是属于该主题的所述关键词的集合,所述创建步骤包括:
人工定义一组预设主题词;
对所提取的工单的关键词进行词性类别分类处理;
比较所述关键词的词向量与各个预设主题的词向量的相似度;
对所述关键词与所述主题词的相似度进行排序,并选择相似度较高的关键词来创建所述基础主题关键词词袋;
在创建了所述基础主题关键词词袋之后,接收新的工单;
对所述工单进行数据整合以转换成对应的文本信息;
从所述文本信息中提取地理位置信息,并采用经纬度坐标转换算法将所提取的地理位置信息转换成对应的地理坐标;
对所述工单的文本信息进行词频统计及关键词获取;
通过将所提取的所述工单的关键字与创建的各基础主题关键词词袋中的关键字进行匹配,从而确定所述工单所属的主题类别;以及
将所述工单和其主题类别及其与地理位置信息对应的地理坐标相关联地存储到存储器中的工单数据库;
其中,所述方法还包括:
通过语义上下文关联模型,依据词性类别相关性和词性类别预测,对所述基础主题词词袋当中部分干扰词汇进行排除,所述语义上下文关联模型包括:基于Viterbi算法的上下文感知器,用于对上文词、当前词和下文词的词性向量转变概率表示,来得到当前词的词性类别预测;
当接收到新工单时,重复执行所述数据整合、词频统计及关键词获取以及主题类别与词袋创建的步骤以更新所创建的基础主题关键词词袋。
2.一种工单处理系统,包括用于执行如权利要求1所述的方法的装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海市黄浦区城市运行管理中心(上海市黄浦区城市网格化综合管理中心、上海市黄浦区大数据中心),未经上海市黄浦区城市运行管理中心(上海市黄浦区城市网格化综合管理中心、上海市黄浦区大数据中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111481594.9/1.html,转载请声明来源钻瓜专利网。