[发明专利]文本分类模型的构建方法、系统以及计算机可读存储介质在审
申请号: | 201811440834.9 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109710757A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 程源泉;欧阳一村 | 申请(专利权)人: | 深圳中兴网信科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 518109 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本分类模型 对话信息 卷积神经网络 构建 计算机可读存储介质 并行 文本分类 上下文关联关系 构建系统 训练过程 训练结果 采集 | ||
1.一种文本分类模型的构建方法,其特征在于,包括:
采集至少三轮对话信息;
将所述至少三轮对话信息并行输入至卷积神经网络文本分类模型;
根据所述至少三轮对话信息对所述卷积神经网络文本分类模型进行训练,得到所述文本分类模型。
2.根据权利要求1所述的文本分类模型的构建方法,其特征在于,
所述至少三轮对话信息通过以下任意一种方式并行输入至卷积神经网络文本分类模型:
使用字向量映射的方式将所述至少三轮对话信息中每一轮对话信息逐字映射到向量空间,生成对应的第一图像,将所述至少三轮对话信息对应的第一图像并行输入至所述卷积神经网络文本分类模型;
将所述至少三轮对话信息通过独热编码编译成第二图像输入至所述卷积神经网络文本分类模型。
3.根据权利要求2所述的文本分类模型的构建方法,其特征在于,
所述根据所述至少三轮对话信息对所述卷积神经网络文本分类模型进行训练,得到所述文本分类模型,具体包括:
将所述第一图像或所述第二图像输入至卷积层进行卷积运算,并将运算结果输入池化层中使用预设方法进行降采样处理;
将降采样处理结果输入至全连接层,通过分类器进行分类,并将分类结果输入至优化器进行优化,得到所述文本分类模型。
4.根据权利要求3所述的文本分类模型的构建方法,其特征在于,所述预设方法为max-pooling。
5.根据权利要求3所述的文本分类模型的构建方法,其特征在于,所述将降采样处理结果输入至全连接层,通过分类器进行分类,并将分类结果输入至优化器进行优化具体包括:
将降采样处理结果输入至全连接层,通过sigmoid分类器进行分类,根据选定的sigmoid损失函数进行迭代运算,直至所述sigmoid损失函数的数值最小。
6.根据权利要求5所述的文本分类模型的构建方法,其特征在于,所述根据选定的sigmoid损失函数进行迭代运算,直至所述sigmoid损失函数的数值最小具体包括:
使用Adam改进后的随机梯度下降算法对选定的所述sigmoid损失函数进行迭代运算,直至所述sigmoid损失函数的数值最小。
7.根据权利要求2所述的文本分类模型的构建方法,其特征在于,所述字向量为采用中英文翻译训练改进的Cove预训练字向量。
8.根据权利要求2所述的文本分类模型的构建方法,其特征在于,
在所述将降采样处理结果输入至全连接层之后,在所述通过sigmoid分类器进行分类之前,还包括:
将所述将降采样处理结果依次输入dropout和relu激活。
9.根据权利要求1所述的文本分类模型的构建方法,其特征在于,在采集至少三轮对话信息之后,在所述将所述至少三轮对话信息并行输入至卷积神经网络文本分类模型之前,还包括:
对所述至少三轮对话信息进行数据清洗。
10.一种文本分类模型的构建系统,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以:
采集至少三轮对话信息;
将所述至少三轮对话信息并行输入至卷积神经网络文本分类模型;
根据所述至少三轮对话信息对所述卷积神经网络文本分类模型进行训练,得到所述文本分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中兴网信科技有限公司,未经深圳中兴网信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811440834.9/1.html,转载请声明来源钻瓜专利网。