[发明专利]一种基于文本循环神经网络的政务文本分类方法及系统在审
申请号: | 202110685564.3 | 申请日: | 2021-06-21 |
公开(公告)号: | CN113505222A | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 王红;庄鲁贺;滑美芳;李威;张慧;韩书 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G06F40/117;G06F40/242;G06F40/279;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 闫伟姣 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 循环 神经网络 政务 分类 方法 系统 | ||
本发明公开了一种基于文本循环神经网络的政务文本分类方法及系统,获取政务文本数据及其对应的类别标签;构建文本循环神经网络分类模型,文本循环神经网络分类模型包括用于将政务文本数据映射为向量的嵌入层、双层长短期记忆网络层和全连接层;根据政务文本数据和类别标签训练文本循环神经网络分类模型;其中,在双层长短期记忆网络层中,双向长短期记忆网络的输出嵌入向量和输入嵌入向量进行拼接,将得到的拼接向量输入到单向长短期记忆网络中,由全连接层对单向长短期记忆网络的输出向量的长度进行收缩,以与类别标签数量对应;根据训练后的文本循环神经网络分类模型得到待分类政务文本数据的分类结果。具备较高的分类准确率和处理效率。
技术领域
本发明涉及数据分析挖掘技术领域,特别是涉及一种基于文本循环神经网络的政务文本分类方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
近年来,网络问政平台上各类与社情民意相关的文本数据量在不断地攀升,给以往靠人工对留言进行划分和对热点问题进行整理的工作带来极大的挑战。同时,随着人工智能、大数据、云计算等技术的发展,已趋向于建立基于自然语言处理技术的智慧政务系统。
目前,针对各类问政平台汇集的留言信息,传统方法是通过人工对每条留言进行判断,判断留言回复工作的所属部门,但是随着对办事效率的要求以及留言数据量的增加,传统的人工分类方法已经不能满足目前的需求,而数据挖掘技术虽已应用于众多领域中,但是,根据历史留言信息,利用数据挖掘技术,对群众留言进行类别划分尚缺乏有效的解决方案。
发明内容
为了解决现有技术的不足,本发明提供了一种基于文本循环神经网络的政务文本分类方法及系统,构建包括用于将政务文本数据映射为向量的嵌入层、双层长短期记忆网络层和全连接层的文本循环神经网络分类模型,对网络问政平台中的政务留言文本数据进行分类,具备较高的分类准确率和处理效率。
为了实现上述目的,本发明采用如下技术方案:
第一方面,本发明提供一种基于文本循环神经网络的政务文本分类方法,包括:
获取政务文本数据及其对应的类别标签;
构建文本循环神经网络分类模型,文本循环神经网络分类模型包括用于将政务文本数据映射为向量的嵌入层、双层长短期记忆网络层和全连接层;
根据政务文本数据和类别标签训练文本循环神经网络分类模型;其中,在双层长短期记忆网络层中,双向长短期记忆网络的输出嵌入向量和输入嵌入向量进行拼接,将得到的拼接向量输入到单向长短期记忆网络中,由全连接层对单向长短期记忆网络的输出向量的长度进行收缩,以与类别标签数量对应;
根据训练后的文本循环神经网络分类模型得到待分类政务文本数据的分类结果。
作为可选择的实施方式,对政务文本数据经预处理后进行特征提取,得到word2vec词向量。
作为可选择的实施方式,对word2vec词向量通过CBOW模型进行训练后用于分类。
作为可选择的实施方式,对类别标签进行编码,得到标签映射列表,将政务文本数据进行单字转换映射后,构建词向量。
作为可选择的实施方式,对类别标签采用onehot编码。
作为可选择的实施方式,训练文本循环神经网络分类模型的过程中,在嵌入层中将政务文本数据映射为二维向量,在双向长短期记忆网络中输出一维向量,并将双向长短期记忆网络的输出嵌入向量和输入嵌入向量进行拼接。
作为可选择的实施方式,对政务文本数据进行预处理,包括:
确定政务文本数据的缺失值比例,根据缺失值比例,清理缺失值所在的政务文本数据或填充缺失值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110685564.3/2.html,转载请声明来源钻瓜专利网。