[发明专利]一种基于深度学习的电力疑似投诉工单识别方法有效
申请号: | 201710938687.7 | 申请日: | 2017-10-11 |
公开(公告)号: | CN107861942B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 罗欣;张爽;景伟强;朱蕊倩;魏骁雄;孙婉胜;葛岳军 | 申请(专利权)人: | 国网浙江省电力有限公司营销服务中心;浙江华云信息科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/33;G06F16/35;G06N3/08;G06Q30/00;G06Q50/06 |
代理公司: | 浙江翔隆专利事务所(普通合伙) 33206 | 代理人: | 王晓燕 |
地址: | 311100 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 电力 疑似 投诉 识别 方法 | ||
1.一种基于深度学习的电力疑似投诉工单识别方法,其特征在于包括以下步骤:
1)深度学习模型配置:用于对学习模板涉及的算法参数进行统一配置管理,实现模型参数分项状态监控与动态配置,涉及深度学习模型参数的信息包括模型编号、模型名称、功能业务描述、正则参数、随机数、矩阵行数、矩阵列数、迭代次数、学习速率、模型对象类、神经网络层数;
2)投诉特征标签提炼:用于对历史投诉样本工单受理内容经过Word2Vector类处理,结合百度词库进行对工单内容进行格式化分词,通过系统对历史投诉样本机器学习,自动提取投诉特有标签词;同时考虑个别词组之间需要重组,将这些标签词在原有样本工单内容进行系统标注,在人工干预下最后将个别标签词进行重组提炼,形成投诉特征向量标签;投诉特征向量标签包括:表计线接错、民事赔偿、超时限、施工人员服务违规、无故停电、野蛮施工、态度恶劣、故障处理不完善、非常不满、废弃设备清理、错发户号、频繁停电、频繁跳闸、电压质量长时间异常、业务报装超时限、严重影响、家电损坏、人员违规、人身伤亡、人员服务规范、态度差、未按停电计划停送电、供电频率长时间异常、低电压、环节处理问题、停送电信息公告准确性、设备位置、营业厅服务、农网改造、抢修质量、超时限中的多种或全部;
3)投诉样本格式化:用于对投诉样本进行过滤冗余词、分词格式化处理,在停用词库中增加需要过滤的词,包括工单中的问候语、套话信息,获取投诉结构化语言表达式并回写数据库;
4)模型学习训练:投诉文本数值转译表述,采用向量空间模型,将文本分为若干的特征项,计算出每个特征项在该文本中的权重,进而将整个文本用以特征项的权重为分量的向量来表示,将文本用特征向量的方式表示为数学模型,再基于投诉样本向量分组进行迭代学习;对疑似投诉工单识别的学习模型实现人工实时监督再学习或者非人工模式下自学习,并支持通过学习训练进度窗口展现后台对模型深度学习过程与学习输出;
5)疑似投诉识别:通过文本相似度判断进行疑似投诉识别;文档分词采用空间向量表述,文本之间的语义相似度通过空间中的这两个向量间的几何关系来度量;基于已学习的模型成果对所有95598来电受理工单进行逐一判定;
6)疑似投诉分类:基于已学习的模型成果对已判断的疑似投诉工单进行逐一分类;包括一级分类、二级分类、三级分类,一级分类包括:服务拆诉、营业投拆、停送电投拆、供电质量、电网建设;
在步骤3)中投诉样本格式化的步骤包括:
301)投诉样本导入数据库;
302)过滤投拆内容数字和英文;
303)利用分词器结合词库和投诉特征向量标签进行内容分词;
304)过滤停用词;
305)获取投诉结构化语句表达式并回写数据库;
在步骤4)中,模型学习训练的步骤包括以下步骤:
401)根据模型获取学习模型参数,包括正则参数、迭代次数、学习速率、神经网络层数;
402)通过模型对象类参数定位学习模型对象类;
403)判断该模型是否有可学习的样本数据;若有,则进入步骤404),否则跳至步骤412);
404)创建学习模型;
405)获取投拆样本格式化数据;
406)样本向量化处理,将格式化投拆内容与投诉分类按照已定义的学习模型进行向量数组实例化;
407)将实例化向量数据顺序随机排列;
408)判断能力是否小于学习迭代次数;若小于学习迭代次数,则进入步骤409),否则,跳至步骤412);
409)数据库同步记录学习进度,包括当前学习次数、学习时间间隔;
410)对实例化向量数据进行分组学习;
411)分组学习完成重新初始化向量索引,回至步骤408);
412)完成学习任务将学习模型回写数据库;
在步骤5)中疑似投拆识别包括以下步骤:
501)从数据库获取已学习的投诉样本模型;
502)基于已学习的模型实例化模型对象;
503)逐一工单识别是否小于待识别工单数量;若是,则进入步骤504);否则结束;
504)对待识别工单受理内容语句分词处理;
505)语句分词转向量处理;
506)基于学习模型进行相似度识别判定;
507)疑似投诉判定,判断相似度是否超过设定值;若是,则进入步骤508);否则回至步骤503);
508)得到疑似投诉工单,并回至步骤503)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司营销服务中心;浙江华云信息科技有限公司,未经国网浙江省电力有限公司营销服务中心;浙江华云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710938687.7/1.html,转载请声明来源钻瓜专利网。