[发明专利]一种基于稀疏权值神经网络的语义分类方法、系统和介质在审

申请号：	201910558051.9	申请日：	2019-06-26
公开（公告）号：	CN110413993A	公开（公告）日：	2019-11-05
发明（设计）人：	孙健;彭德光;唐贤伦	申请（专利权）人：	重庆兆光科技股份有限公司
主分类号：	G06F17/27	分类号：	G06F17/27;G06F16/35;G06N3/04;G06N3/08
代理公司：	重庆渝之知识产权代理有限公司 50249	代理人：	柴社英
地址：	400000 重庆市沙坪***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	稀疏神经网络分类神经网络训练目标语义分类最大似然函数目标函数输出概率样本分类词向量样本集标注样本神经网络模型分类算法文本分类文本向量文本序列稀疏处理输入层构建权重创建转换
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出一种基于稀疏权值神经网络的语义分类方法、系统和介质，包括：设置样本集，将所述样本集中的文本序列转换成词向量，根据所述词向量计算得到文本向量；对所述样本集进行标注，根据已标注样本，创建样本分类训练目标；创建神经网络分类模型，计算所述样本分类训练目标的输出概率，并根据所述输出概率构造所述文本分类训练目标的最大似然函数；对所述神经网络分类模型的输入层权重进行稀疏处理，获取稀疏正则函数；将所述稀疏正则函数加入所述最大似然函数，构建所述神经网络的目标函数，并根据所述目标函数对所述神经网络分类模型进行训练，获取语义分类神经网络模型；本发明可以提高分类算法的计算速度和泛化能力。

技术领域

本发明涉及自然语言处理领域，尤其涉及一种基于稀疏权值神经网络的语义分类方法、系统和介质。

背景技术

在自然语言处理领域，处理的数据集往往为高维或超高维数据集，且这些高维数据集通常具有复杂的结构。虽然数据集维度足够大，但实际只有小部分变量与所要预测的输出变量相关，其余的大部分变量为噪声变量。而样本数量过小，直接采用传统最小二乘法等传统的建模工具，得到的模型往往存在数值计算准确度低的问题，因此，变量的选择显得尤为重要。套索模型是第一种利用正则化方法进行变量选择的模型，然而变量往往具有组结构，套索模型没有将变量的组结构作为先验信息，局限于变量水平上的稀疏性，只有变量选择能力，缺乏组选择能力。

发明内容

鉴于以上现有技术存在的问题，本发明提出一种基于稀疏权值神经网络的语义分类方法、系统和介质，主要解决问题现有文本分类算法泛化能力不足的问题。

为了实现上述目的及其他目的，本发明采用的技术方案如下。

一种基于稀疏权值神经网络的语义分类方法，包括：

设置样本集，将所述样本集中的文本序列转换成词向量，根据所述词向量计算得到文本向量；

对所述样本集进行标注，根据已标注样本，创建样本分类训练目标；

创建神经网络分类模型，计算所述样本分类训练目标的输出概率，并根据所述输出概率构造所述文本分类训练目标的最大似然函数；

对所述神经网络分类模型的输入层权重进行稀疏处理，获取稀疏正则函数；

将所述稀疏正则函数加入所述最大似然函数，构建所述神经网络的目标函数，并根据所述目标函数对所述神经网络分类模型进行训练，获取语义分类神经网络模型。

可选地，所述计算文本向量包括：

构造与所述词向量关联的核函数，并根据所述核函数创建对应词向量的径向基；

构造径向基与所述文本向量的函数关系，将所述词向量输入所述所述径向基与所述文本向量的函数关系中，并将计算结果映射到[-1,1]区间，获取文本向量。