[发明专利]一种基于深度学习的检修意见自动分类方法及系统在审
申请号: | 202011491138.8 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112507117A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 单政博;许士锦;杨林;吴小刚;张勇;辛阔;程哲;孙雁斌;王巍;周永灿;陈兴望;张坤;王子强 | 申请(专利权)人: | 中国南方电网有限责任公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/279 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 史俊军 |
地址: | 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 检修 意见 自动 分类 方法 系统 | ||
本发明公开了一种基于深度学习的检修意见自动分类方法,包括将待分类的检修意见进行按句拆分,并将拆分后的句子进行分词;根据分词结果,构建词向量模型,并将词向量模型和预设词列表库中的词关联;其中,词列表库基于电力专业词汇的释义构建;将分词结果和关联后的词向量模型输入预先训练的分类模型,获得分类结果。同时公开了相应的系统。本发明利用分类模型,实现检修意见的自动分类;同时本发明将检修意见的词向量模型和词列表库中的词关联,对词向量进行扩充,减少计算维度。
技术领域
本发明涉及一种基于深度学习的检修意见自动分类方法及系统,属于电网检修领域。
背景技术
检修意见对检修单的实施具有指导作用,为了防止在检修前、检修中、检修后出现问题,各部门对检修都会提出指导性的意见,意见的增加给实施人员增加了工作量,能够自动识别检修意见中意见种类,并在实施人员阅读时分别标记显示具有重要的意义。
当前调度、安自、自动化等各部门在编写检修单意见时,不会对输入内容进行按句分类标记。实施人员在进行检修意见的阅读过程中,采用无差别阅读,不能直观的获取当前检修意见中的重点、次重点等内容。如果强行要求各部门在编写意见时对意见进行分类,将增加意见编写人员的工作量,同时增加了系统使用的复杂度,易用性将受影响;所以实现检修意见的自动分类势在必行。
发明内容
本发明提供了一种基于深度学习的检修意见自动分类方法及系统,解决了背景技术中披露的问题。
为了解决上述技术问题,本发明所采用的技术方案是:
一种基于深度学习的检修意见自动分类方法,包括,
将待分类的检修意见进行按句拆分,并将拆分后的句子进行分词;
根据分词结果,构建词向量模型,并将词向量模型和预设词列表库中的词关联;其中,词列表库基于电力专业词汇的释义构建;
将分词结果和关联后的词向量模型输入预先训练的分类模型,获得分类结果。
将待分类的检修意见进行按句拆分,若拆分后的句子长度不小于阈值,则将该句子进行分词。
训练分类模型的过程为,
从历史检修单中获取检修意见,将其进行按句拆分;
对拆分后的句子进行标记,构建样本语料;
根据电力专业词汇表,从网络抓取电力专业词汇的释义,构建扩充语料;
对样本预料和扩充语料中的句子进行分词;
统计分词获得的词语,构建词列表库;
根据分词结果构建词向量模型,并将词向量模型和词列表库中的词关联;
将样本语料中训练语料的分词结果、关联后的词向量模型输入分类模型,进行训练。
标记包括0、1、2、3、4和5,其中,0代表“注意”,1表示“前置操作”,2表示“后置操作”,3表示“过程操作”,4表示“描述信息”,5表示“普通用语。
对样本预料和扩充语料中的句子进行分词,并去除停用词。
分类模型采用BI_LSTM模型。
一种基于深度学习的检修意见自动分类系统,包括,
拆分分词模块:将待分类的检修意见进行按句拆分,并将拆分后的句子进行分词;
词向量模型模块:根据分词结果,构建词向量模型,并将词向量模型和预设词列表库中的词关联;其中,词列表库基于电力专业词汇的释义构建;
分类模块:将分词结果和关联后的词向量模型输入预先训练的分类模型,获得分类结果。
还包括分类模型训练模块,分类模型训练模块包括,
拆分模块:从历史检修单中获取检修意见,将其进行按句拆分;
样本语料构建模块:对拆分后的句子进行标记,构建样本语料;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司,未经中国南方电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011491138.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种食用花生油制备加工工艺
- 下一篇:一种扭矩和钻压恒定钻井装置