[发明专利]一种基于深度学习的检修意见自动分类方法及系统在审
申请号: | 202011491138.8 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112507117A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 单政博;许士锦;杨林;吴小刚;张勇;辛阔;程哲;孙雁斌;王巍;周永灿;陈兴望;张坤;王子强 | 申请(专利权)人: | 中国南方电网有限责任公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/279 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 史俊军 |
地址: | 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 检修 意见 自动 分类 方法 系统 | ||
1.一种基于深度学习的检修意见自动分类方法,其特征在于:包括,
将待分类的检修意见进行按句拆分,并将拆分后的句子进行分词;
根据分词结果,构建词向量模型,并将词向量模型和预设词列表库中的词关联;其中,词列表库基于电力专业词汇的释义构建;
将分词结果和关联后的词向量模型输入预先训练的分类模型,获得分类结果。
2.根据权利要求1所述的一种基于深度学习的检修意见自动分类方法,其特征在于:将待分类的检修意见进行按句拆分,若拆分后的句子长度不小于阈值,则将该句子进行分词。
3.根据权利1所述的一种基于深度学习的检修意见自动分类方法,其特征在于:训练分类模型的过程为,
从历史检修单中获取检修意见,将其进行按句拆分;
对拆分后的句子进行标记,构建样本语料;
根据电力专业词汇表,从网络抓取电力专业词汇的释义,构建扩充语料;
对样本预料和扩充语料中的句子进行分词;
统计分词获得的词语,构建词列表库;
根据分词结果构建词向量模型,并将词向量模型和词列表库中的词关联;
将样本语料中训练语料的分词结果、关联后的词向量模型输入分类模型,进行训练。
4.根据权利3所述的一种基于深度学习的检修意见自动分类方法,其特征在于:标记包括0、1、2、3、4和5,其中,0代表“注意”,1表示“前置操作”,2表示“后置操作”,3表示“过程操作”,4表示“描述信息”,5表示“普通用语。
5.根据权利3所述的一种基于深度学习的检修意见自动分类方法,其特征在于:对样本预料和扩充语料中的句子进行分词,并去除停用词。
6.根据权利1~5任意一项所述的一种基于深度学习的检修意见自动分类方法,其特征在于:分类模型采用BI_LSTM模型。
7.一种基于深度学习的检修意见自动分类系统,其特征在于:包括,
拆分分词模块:将待分类的检修意见进行按句拆分,并将拆分后的句子进行分词;
词向量模型模块:根据分词结果,构建词向量模型,并将词向量模型和预设词列表库中的词关联;其中,词列表库基于电力专业词汇的释义构建;
分类模块:将分词结果和关联后的词向量模型输入预先训练的分类模型,获得分类结果。
8.根据权利要求7所述的一种基于深度学习的检修意见自动分类系统,其特征在于:还包括分类模型训练模块,分类模型训练模块包括,
拆分模块:从历史检修单中获取检修意见,将其进行按句拆分;
样本语料构建模块:对拆分后的句子进行标记,构建样本语料;
扩充语料构建模块:根据电力专业词汇表,从网络抓取电力专业词汇的释义,构建扩充语料;
分词模块:对样本预料和扩充语料中的句子进行分词;
词列表库构建模块:统计分词获得的词语,构建词列表库;
模型关联模块:根据分词结果构建词向量模型,并将词向量模型和词列表库中的词关联;
训练模块:将样本语料中训练语料的分词结果、关联后的词向量模型输入分类模型,进行训练。
9.一种存储一个或多个程序的计算机可读存储介质,其特征在于:所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1至7所述的方法中的任一方法。
10.一种计算设备,其特征在于:包括,
一个或多个处理器、一个或多个存储器以及一个或多个程序,其中一个或多个程序存储在所述一个或多个存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1至7所述的方法中的任一方法的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司,未经中国南方电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011491138.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种食用花生油制备加工工艺
- 下一篇:一种扭矩和钻压恒定钻井装置