[发明专利]基于深度学习的问题分类模型训练方法、分类方法及装置有效
申请号: | 201710375175.4 | 申请日: | 2017-05-24 |
公开(公告)号: | CN107291822B | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 鄂海红;宋美娜;王昕睿;胡莺夕;赵鑫禄;白杨;王宁 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06N20/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 100876 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 问题 分类 模型 训练 方法 装置 | ||
本发明公开了一种基于深度学习的问题分类模型训练方法、问题分类方法以及装置。其中问题分类模型训练方法包括:提取问题文本样本中的特征信息样本,并生成对应的第一特征向量样本;对第一特征向量样本进行空间变换,得到第二特征向量样本;将第二特征向量样本输入至多层卷积神经网络中的多个卷积层和多个池化层,以通过叠加卷积操作和池化操作,得到第一融合特征向量样本;将第一融合特征向量样本输入至多层卷积神经网络中的全连接层,得到全局特征向量样本;根据全局特征向量样本对Softmax分类器进行训练,得到问题分类模型。该方法可免去大量人工设计特征的开销,通过该问题分类模型可以得到更加准确的分类结果,提高了标准问题与答案的定位。
技术领域
本发明涉及计算机与互联网技术领域,尤其涉及一种基于深度学习的问题分类模型训练方法、问题分类方法以及装置。
背景技术
目前的问答系统面临人力资源消耗大、响应不及时等缺陷。自动问答系统的目标是在给定问题情况下,给出简短、精确的答案,无论是业界应用还是学术研究,问句的真实意图分析、问句与答案之间的匹配关系判别仍然是制约自动问答系统性能的两个关键难题。众所周知,问题分类根据预期答案对问题进行分类,可快速定位标准问题与答案的大概位置。所以,问题分类是自动问答系统中分析问句真实意图、判别问句与答案匹配关系的重要模块,问题分类的效率和精度显著地影响着问答系统的性能。
相关技术中,目前的问题分类研究大多基于机器学习的方法,致力于从问题中提取词法、句法、语义特征,研究在人工定义特征之上的关系学习,模型的效果很依赖特征的设计,然后应用例如朴素贝叶斯、决策树、支持向量机、最大熵等各种监督学习的方法来构建分类器,进而进行预测。
但是,目前存在的问题是,机器学习需要人工提取特征,模型的精度很依赖特征的设计,并且,问答系统中用户的输入问题通常属于短文本且用词多样、随意、不规范,人工提取特征很难提取到丰富的语义特征,而且设计的特征不具备通用性,从而导致问题的分类结果不准确,进而影响标准问题与答案的定位,导致用户体验变差。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种基于深度学习的问题分类模型训练方法。该方法利用深度学习方法,可以自动从原始数据中抽取特征,免去了大量人工设计特征的开销,并且通过该问题分类模型对用户的输入问题进行预测,可以得到更加准确的分类结果,提高了标准问题与答案的定位,提升了用户体验。
本发明的第二个目的在于提出一种问题分类方法。
本发明的第三个目的在于提出一种基于深度学习的问题分类模型训练装置。
本发明的第四个目的在于提出一种问题分类装置。
为达到上述目的,本发明第一方面实施例提出的基于深度学习的问题分类模型训练方法,包括:获取问题文本样本;提取所述问题文本样本中的特征信息样本,并根据所述特征信息样本生成对应的第一特征向量样本;对所述第一特征向量样本进行空间变换,得到第二特征向量样本;将所述第二特征向量样本输入至多层卷积神经网络中的多个卷积层和多个池化层,以通过叠加卷积操作和池化操作,得到第一融合特征向量样本;将所述第一融合特征向量样本输入至所述多层卷积神经网络中的全连接层,得到全局特征向量样本;根据所述全局特征向量样本对Softmax分类器进行训练,得到所述问题分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710375175.4/2.html,转载请声明来源钻瓜专利网。