[发明专利]面向社区问答的问题分类方法及系统有效
申请号: | 202010122754.X | 申请日: | 2020-02-27 |
公开(公告)号: | CN111353032B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 陈羽中;张衍坤 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06N3/08;G06N3/04 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 丘鸿超;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 社区 问答 问题 分类 方法 系统 | ||
1.一种面向社区问答的问题分类方法,其特征在于,包括以下步骤:
步骤A:采集网络问答社区中用户所提问题以及对应的问题类别,构建问题分类训练集TS;
步骤B:对问题分类训练集TS中的问题进行字符级编码和词语级编码,得到问题的表征向量,以此训练基于双通道神经网络的深度学习网络模型;
步骤C:问题分类系统接受用户提交的问题,将问题输入到训练好的深度学习网络模型中,输出模型划分的问题所述类别;
所述步骤B具体包括以下步骤:
步骤B1:遍历问题分类训练集TS,TS中的每个训练样本表示为(q,y),其中q表示问题,y=c∈C表示问题q所属的问题类别,C={1,2,...,L}为问题类别集合,1≤c≤L,L表示问题类别数;将问题q输入深度学习网络模型的字符级编码模块,得到问题q的字符向量序列
步骤B2:将问题q的字符向量序列输入深度学习网络模型的双层Bi-LSTM网络模块,再输入注意力模块,得到问题q的表征向量
步骤B3:将问题q输入深度学习网络模型的词语级编码模块,得到问题q的词语级表征向量
步骤B4:将问题q的词语级表征向量输入到深度学习网络模型的带shortcut连接的卷积神经网络中,得到问题q的表征向量
步骤B5:将问题q的表征向量与输入全连接层进行融合,得到问题q的最终表征向量将输入到Softmax层中,计算问题q属于各个问题类别的概率选择作为预测的问题类别;
步骤B6:根据目标损失函数loss,利用反向传播方法计算深度学习网络模型中各参数的梯度,并利用随机梯度下降方法更新参数,以此训练深度学习网络模型;
步骤B7:当深度学习网络模型的损失值迭代变化小于设定阈值或者达到最大迭代次数时,则终止深度学习网络模型的训练。
2.根据权利要求1所述的面向社区问答的问题分类方法,其特征在于,所述步骤B1具体包括以下步骤:
步骤B11:对问题q进行分词处理,并去除停用词,得到问题q的词序列q={w1,w2,...,wk},其中wi,i=1,2,...,k为分词及去除停用词后的问题q中的第i个词,k为分词及去除停用词后的问题q中的词语数,其中ci,j,j=1,2,...,ni为构成wi的第j个字符,ni为wi中的字符数;
步骤B12:对问题q的词序列q={w1,w2,...,wk}中的每个词wi进行字符级编码,wi的字符序列为则wi的字符向量序列为其中为ci,j的字符向量,在预训练的字符向量矩阵中查询得到,其中d1表示字符向量的维度,|V1|表示字符向量矩阵E1中的字符总数;则问题q的字符向量序列为
3.根据权利要求2所述的面向社区问答的问题分类方法,其特征在于,所述步骤B2具体包括以下步骤:
步骤B21:遍历问题q的每个词wi,将其字符向量序列输入第一层Bi-LSTM网络,得到wi的隐藏状态序列取作为wi的词向量即则问题q的词向量序列为
步骤B22:将输入第二层Bi-LSTM网络,得到问题q的隐藏状态序列h=[h1,h2,...,hi,...,hk],其中hi为的隐藏状态;
步骤B23:将问题q的隐藏状态序列h=[h1,h2,...,hi,...,hk]输入到注意力层,输出问题q的表征向量
其中,Wa表示权重矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010122754.X/1.html,转载请声明来源钻瓜专利网。