[发明专利]文本分类模型的构建方法、系统以及计算机可读存储介质在审
申请号: | 201811440834.9 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109710757A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 程源泉;欧阳一村 | 申请(专利权)人: | 深圳中兴网信科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 518109 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本分类模型 对话信息 卷积神经网络 构建 计算机可读存储介质 并行 文本分类 上下文关联关系 构建系统 训练过程 训练结果 采集 | ||
本发明提出了一种文本分类模型的构建方法、文本分类模型的构建系统和计算机可读存储介质。其中,文本分类模型的构建方法包括:采集至少三轮对话信息;将至少三轮对话信息并行输入至卷积神经网络文本分类模型;根据至少三轮对话信息对卷积神经网络文本分类模型进行训练,得到文本分类模型。利用并行输入的对话信息对卷积神经网络文本分类模型进行训练,由于训练过程中使用的并行输入的信息具有上下文关联关系的对话信息,因此,得到的训练结果能够实现结合上下文进行文本分类,进而提高文本分类的准确性。
技术领域
本发明涉及文本分类技术领域,具体而言,涉及一种文本分类模型的构建方法、文本分类模型的构建系统和计算机可读存储介质。
背景技术
多通道卷积神经网络多应用在图像处理领域,如应用在人机交互中图像识别,或者在视频目标图像追踪中,实现了目标的快速确定。
相关技术中,文本分类运用的是softmax分类器(一种损失函数运用softmax函数的分类器),但softmax函数有严重的问题是softmax分类输出的概率(0~1)互斥。某一类别概率高会让其他类别概率都很低。比如在政务文本分类中,一条数据既是社保类别又是征缴业务类别,所以很难用单一类别判断数据。Softmax分类器原本用于卷积神经网络图像识别,需要对1000个label(标签)输出确定类别,然而,相关技术中,文本分类运用过程中是对单一数据的进行训练的结果,得到的训练模型不能对具有上下文关联的信息进行关联处理,致使准确率较低。
因此,亟需一种文本分类模型的构建方法,以使构建得到的模型能够实现上下文关联处理,进而提高分类的准确性。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明第一个方面在于提出一种文本分类模型的构建方法。
本发明的第二个方面在于提出一种文本分类模型的构建系统。
本发明的第三个方面在于提出一种计算机可读存储介质。
有鉴于此,根据本发明的一个方面,提出了一种文本分类模型的构建方法,包括:采集至少三轮对话信息;将至少三轮对话信息并行输入至卷积神经网络文本分类模型;根据至少三轮对话信息对卷积神经网络文本分类模型进行训练,得到文本分类模型。
本发明提供的文本分类模型的构建方法,采集至少三轮对话信息,其中至少三轮对话信息可以来源于真实场景下的人机交互场景,或者为对话双方的记录信息,例如医疗场景下的对话信息,也可以是人社局工作人员和办理人员的交谈对话信息;将获取得到的对话信息并行输入至CNN文本分类模型中,(CNN,Convolutional Neural Networks卷积神经网络),利用并行输入的对话信息对CNN文本分类模型进行训练,由于训练过程中使用的并行输入的信息具有上下文关联关系的对话信息,因此,得到的训练结果能够实现结合上下文进行文本分类,进而提高文本分类的准确性。
根据本发明的上述文本分类模型的构建方法,还可以具有以下技术特征:
在上述技术方案中,优选地,至少三轮对话信息通过以下任意一种方式并行输入至卷积神经网络文本分类模型:使用字向量映射的方式将至少三轮对话信息中每一轮对话信息逐字映射到向量空间,生成对应的第一图像,将至少三轮对话信息对应的第一图像并行输入至卷积神经网络文本分类模型;将至少三轮对话信息通过独热编码编译成第二图像输入至卷积神经网络文本分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中兴网信科技有限公司,未经深圳中兴网信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811440834.9/2.html,转载请声明来源钻瓜专利网。