[发明专利]文本意图智能分类方法、装置及计算机可读存储介质在审
申请号: | 201910525743.3 | 申请日: | 2019-06-14 |
公开(公告)号: | CN110347789A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 王健宗;程宁 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 于志光;高杰 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 文本集 意图识别 智能分类 词向量 计算机可读存储介质 原始文本 测试集 标签 人工智能技术 智能分类装置 标点符号 接收用户 输出判断 训练要求 停用词 训练集 去除 分类 退出 转换 | ||
1.一种文本意图智能分类方法,其特征在于,所述方法包括:
步骤A:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集;
步骤B:将所述初级文本集转换为词向量文本集,并将所述词向量文本集分类成训练集和测试集;
步骤C:将所述训练集及所述标签集输入至预先构建的意图识别模型中训练,直到所述意图识别模型满足预设训练要求后退出训练;
步骤D:将所述测试集输入至所述意图识别模型中进行文本意图判断,计算对所述文本意图的判断结果与所述标签集中内容的匹配准确率,若所述匹配准确率小于预设准确率,返回步骤C,若所述匹配准确率大于所述预设准确率,所述意图识别模型完成训练;
步骤E:接收用户的文本,并将所述文本转变为词向量文本输入至所述意图识别模型进行文本意图判断,并输出判断结果。
2.如权利要求1所述的文本意图智能分类方法,其特征在于,所述将所述初级文本集转换为词向量文本集包括:
确定所述初级文本集内每个词语ω在所述初级文本集的出现位置Context(ω);
基于所述出现位置Context(ω)做累加求和操作得到累加求和矩阵Xω,并根据所述Xω建立概率模型;
根据所述概率模型建立对数似然函数,并最大化所述对数似然函数得到所述词向量文本集。
3.如权利要求2所述的文本意图智能分类方法,其特征在于,所述概率模型为:
其中,p(ω|Context(ω))为所述概率模型,Context为所述初级文本集,ω为所述初级文本集内每个词语,表示在路径pω内,第j个结点对应的Huffman编码,表示路径pω内,第j个非叶子结点对应的向量。
4.如权利要求3中的文本意图智能分类方法,其特征在于,所述对数似然函数为:
其中,ζ为所述对数似然函数,是包含了所述初级文本集所有内容的集合,其中,所述对数似然函数ζ基于所述概率模型可进一步扩展为:
其中,lω表示所述路径pω中包括结点的数量,σ为阈值函数。
5.如权利要求1至4任意一项所述的文本意图智能分类方法,其特征在于,所述意图识别模型包括卷积神经网络、激活函数、损失函数,其中,所述卷积神经网络包括十六层卷积层和十六层池化层、一层全连接层;
所述步骤C包括:
所述卷积神经网络接收所述训练集后,将所述训练集输入至所述十六层卷积层和十六层池化层进行卷积操作和最大池化操作得到降维数据集,并将所述降维数据集输入至全连接层;
所述全连接层接收所述降维数据集,并结合所述激活函数计算得到训练值集合,并将所述训练值集合和所述标签集输入至所述损失函数中,所述损失函数计算出损失值,判断所述损失值与预设训练阈值的大小关系,直至所述损失值小于所述预设训练阈值时,所述意图识别模型满足所述预设训练要求并退出训练。
6.一种文本意图智能分类装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的文本意图智能分类程序,所述文本意图智能分类程序被所述处理器执行时实现如下步骤:
步骤A:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集;
步骤B:将所述初级文本集转换为词向量文本集,并将所述词向量文本集分类成训练集和测试集;
步骤C:将所述训练集及所述标签集输入至预先构建的意图识别模型中训练,直到所述意图识别模型满足预设训练要求后退出训练;
步骤D:将所述测试集输入至所述意图识别模型中进行文本意图判断,计算对所述文本意图的判断结果与所述标签集中内容的匹配准确率,若所述匹配准确率小于预设准确率,返回步骤C,若所述匹配准确率大于所述预设准确率,所述意图识别模型完成训练;
步骤E:接收用户的文本,并将所述文本转变为词向量文本输入至所述意图识别模型进行文本意图判断,并输出判断结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910525743.3/1.html,转载请声明来源钻瓜专利网。