[发明专利]基于时间卷积网络的中文文本分类方法在审

申请号：	201910542511.9	申请日：	2019-06-21
公开（公告）号：	CN110275954A	公开（公告）日：	2019-09-24
发明（设计）人：	代明军;谭莎;林晓辉;陈彬;苏恭超;王晖	申请（专利权）人：	深圳大学
主分类号：	G06F16/35	分类号：	G06F16/35;G06F17/27;G06N3/04
代理公司：	深圳市科吉华烽知识产权事务所(普通合伙) 44248	代理人：	陈凯昆
地址：	518000 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	时间卷积文本分类模型目标文本中文文本文本序列分类预处理并行计算类别分析全文信息嵌入层输出层输入层网络层构建网络保留应用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于时间卷积网络的中文文本分类方法，包括以下步骤：步骤S10，对目标文本进行预处理，以得到与目标文本对应的第一文本序列；步骤S20，构建基于时间卷积机制的文本分类模型，将第一文本序列导入到文本分类模型中，完成对于目标文本的类别分析，其中，文本分类模型包括输入层、嵌入层、时间卷积网络层、Dropout层和输出层。本发明，应用于中文文本的分类，能够保留更加完整的全文信息的同时，有更高的并行计算速度。

技术领域

本发明属于文本分类技术领域，尤其涉及一种基于时间卷积网络的中文文本分类方法。

背景技术

目前，近年来随着深度学习的快速发展，人们经常采用神经网络来做文本分类任务，现有的热门的循环神经网络RNN及其衍生LSTM，GRU等存在计算速度低的技术问题。

因此，现有技术有待于改善。

发明内容

本发明的主要目的在于提出一种基于时间卷积网络的中文文本分类方法，旨在解决背景技术中所提及的技术问题，能够保留更加完整的全文信息的同时，有更高的并行计算速度。

本发明的一种基于时间卷积网络的中文文本分类方法，包括以下步骤：

步骤S10，对目标文本进行预处理，以得到与目标文本对应的第一文本序列；

步骤S20，构建基于时间卷积机制的文本分类模型，将第一文本序列导入到文本分类模型中，完成对于目标文本的类别分析，其中，文本分类模型包括输入层、嵌入层、时间卷积网络层、Dropout层和输出层。

优选地，步骤S20具体包括：

步骤S21，对目标文本进行分词处理，以确定输入元素；