[发明专利]基于双向lstm的维修分类系统在审
申请号: | 202010314234.9 | 申请日: | 2020-04-14 |
公开(公告)号: | CN111694953A | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 程思铭 | 申请(专利权)人: | 程思铭 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06N3/04;G06Q10/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 221000 江苏省徐州市新*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双向 lstm 维修 分类 系统 | ||
本发明公开了一种基于双向lstm的维修分类系统,涉及网络技术领域,该基于双向lstm的维修分类系统首先是根据某单位的维修的文本数据,利用keras、jieba等开源软件框架实现数据预处理、文本分词向量化、构建双向LSTM神经网络、自定义实现注意力机制、使用GPU训练神经网络等一些列步骤。使得整个模型的测试集准确率达到98%以上,完全达到企业级应用的标准。该基于双向lstm的维修分类系统使用神经网络结合自然语言处理技术,实现根据申请的文本进行自动分类的效果。
技术领域
本发明涉及网络技术领域,具体来说,本发明涉及一种基于双向lstm的维修分类系统。
背景技术
目前维修分类工作主要依靠人力去完成,用户发出维修请求的文本或者语音,负责维修分类的工作人员对维修的工作进行分类。用户首先需要通过电话、网络等方式将自己的维修请求反映给负责维修分类的工作人员,这项工作过度依靠维修分类的工作人员相应的经验来判断分类,存在信息传达不及时,或者维修分类的工作人员过少而导致处理工作不及时等问题,但是如果投入的维修分类工作人员过多则相应的人力成本过高。所以这项工作往往效率不高,而且成本过高。
发明内容
本发明所要解决的技术问题是提供一种基于双向lstm的维修分类系统,使用神经网络结合自然语言处理技术,实现根据申请的文本进行自动分类的效果。
为实现上述目的,本发明提供以下的技术方案:
该基于双向lstm的维修分类系统包括数据的基础清洗工作、文本数据分词及其向量化、模型训练及其评价;其中data目录主要是一些数据存储,包括原始文本数据、jieba分词用的停用词词典等。design_dl_model.py文件是核心网络设计的代码,model_eval.py是模型评价指标的工具类,prepare_data.py是处理原始文本的代码,util.py是整个项目工具类,用于保存一些全局的参数设置,方便进行动态的调整,main.py则是整个项目的入口函数,采用词向量+字向量的双输入,最上层的模型输入由两个分别是左边词向量右边字向量,左右两边的处理流程都是一样:第一步确定Embedding层,第二步再对Embedding层分别加上双向LSTM层和Attention层,第三步在LSTM层下面再接一个全连接层。词向量和字向量都按照这三个步骤处理完成之后,再将两边进行拼接,然后下面再加上全连接层和一个Dropout层(用来防止过拟合),核心网络的核心框架是Keras,最后一层的激活函数采用的是softmax,模型的损失函数是categorical_crossentropy,为多分类的交叉熵损失,需要注意的是使用多分类的交叉熵损失函数,y必须是二进制编码的。
采用以上技术方案的有益效果是:该基于双向lstm的维修分类系统首先是根据某单位的维修的文本数据,利用keras、jieba等开源软件框架实现数据预处理、文本分词向量化、构建双向LSTM神经网络、自定义实现注意力机制、使用GPU训练神经网络等一些列步骤。使得整个模型的测试集准确率达到98%以上,完全达到企业级应用的标准。该基于双向lstm的维修分类系统使用神经网络结合自然语言处理技术,实现根据申请的文本进行自动分类的效果。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的描述。
图1是该基于双向lstm的维修分类系统的核心模型架构图;
图2是模型损失值的变化曲线图;
图3是模型准确率的变化曲线图。
具体实施方式
下面结合附图详细地说明该基于双向lstm的维修分类系统的优选实施方式。
图1、图2和图3出示该基于双向lstm的维修分类系统的具体实施方式:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于程思铭,未经程思铭许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010314234.9/2.html,转载请声明来源钻瓜专利网。