[发明专利]基于疑问词分类器的神经网络问题生成方法及生成系统在审
申请号: | 202110498928.7 | 申请日: | 2021-05-08 |
公开(公告)号: | CN113094489A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 陈光;顾鑫彤;李思;徐雅静;徐蔚然 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 高福勇 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 疑问词 分类 神经网络 问题 生成 方法 系统 | ||
1.基于疑问词分类器的神经网络问题生成方法,其特征是:该方法由以下步骤实现:
步骤一、将语料按照真实疑问词的类别进行划分,通过降采样和过采样使得每个类别的样本数量达到均衡;
步骤二、对原始输入文本中的答案词两边添加答案位置标记符,获得预处理后的数据;
步骤三、构建疑问词分类器,所述疑问词分类器由预训练语言模型BERT和前馈神经网络FNN组成;
步骤三一、预训练语言模型BERT模型作为文本特征提取器,对于输入原始文本提取特征向量C;
步骤三二、将BERT模型提取到的特征向量C输入到FNN中,首先通过一个训练参数矩阵Wc将特征向量C映射到一个维度为8的向量矩阵中,每个元素对应一个类别,再通过softmax函数,计算每个类别的概率,输出0-7中的概率最大的类别的id标识P,用下式表示为:
P=softmax(WcC)
步骤四、将步骤二的预处理后的数据划分为训练集、评估集和测试集,分别用于对步骤三所述的疑问词分类器进行训练、评估和测试;
步骤五、采用步骤四测试后的疑问词分类器进行预测,将预测后的疑问词添加到所述原始输入文本的句首,获得预测后的文本;
步骤六、利用词向量映射表,将步骤五获得的预测后的文本映射为向量形式表示,输入的文本即数值化为每个字符向量列连接成的数值矩阵;
步骤七、将步骤六获得的数值矩阵输入到神经网络问题生成模型,输出完整的问题。
2.根据权利要求1所述的基于疑问词分类器的神经网络问题生成方法,其特征在于:步骤六中,所述词向量映射表采用Glove词表。
3.根据权利要求1所述的基于疑问词分类器的神经网络问题生成方法,其特征在于:步骤七中,所述神经网络问题生成模型为基于门控自注意力的段落级问题生成模型。
4.根据权利要求1-3所述的基于疑问词分类器的神经网络问题生成方法的生成系统,其特征是:该生成系统包括答案位置标注模块、疑问词分类器、疑问词添加模块以及神经网络问题生成模型;
所述答案位置标注模块用于对原始输入文本中的答案词两边添加答案位置标记符,获得预处理后的数据;
所述疑问词分类器由预训练语言模型BERT和前馈神经网络FNN组成;采用预训练语言模型BERT对原始输入文提取特征向量C,并将提取的特征向量C输入至前馈神经网络FNN中,
所述前馈神经网络FNN对特征向量C进行映射,每个元素对应一个类别,再通过softmax函数,计算每个类别的概率,输出0-7中的概率最大的类别的id标识;
采用预处理后的数据对疑问词分类器进行训练和测试;并将预测后的疑问词通过疑问词添加模块添加到所述原始输入文本的句首,获得预测后的文本;
将所述预测后的文本映射为向量形式表示,即:将文本数值化为每个字符向量列连接成的数值矩阵;
所述数值矩阵输入到所述神经网络问题生成模型,通过该模型输出完整的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110498928.7/1.html,转载请声明来源钻瓜专利网。