[发明专利]一种基于卷积神经网络的中文问答系统的属性选择方法及存储介质有效
申请号: | 202110210928.2 | 申请日: | 2021-02-25 |
公开(公告)号: | CN112860867B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 匡平;李娜 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F40/211;G06F40/289;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都华风专利事务所(普通合伙) 51223 | 代理人: | 张巨箭 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 中文 问答 系统 属性 选择 方法 存储 介质 | ||
1.一种基于卷积神经网络的中文问答系统的属性选择方法,其特征在于,包括以下内容:
使用多种分词方式分别对问句进行分词,预处理后进行映射得到多个问句词向量矩阵;使用所述多种分词方式分别对候选属性进行分词,预处理后进行映射得到多个属性词向量矩阵;
将所述多个问句词向量矩阵和多个属性词向量矩阵作为模型的输入层,并引入多头自注意力机制分别对所述多个问句词向量矩阵和多个属性词向量矩阵进行变换,得到多个多头自注意力输入矩阵;
对所述多个多头自注意力输入矩阵进行训练后输出问句和候选属性的相似度,并选择相似度最高的候选属性作为最终选择的属性。
2.根据权利要求1所述的一种基于卷积神经网络的中文问答系统的属性选择方法,其特征在于,对所述多个多头自注意力输入矩阵进行训练包括:
第一次训练:将所述多个多头自注意力输入矩阵分别输入到多个卷积神经网络中进行第一次训练并进行第一次池化处理和拼接,得到多个问句特征向量和多个候选属征向量;
将所述多个问句特征向量拼接到一起,形成总问句特征向量,将所述多个候选属征向量拼接到一起,形成总候选属性特征向量;
第二次训练:将所述总问句特征向量和总候选属性特征向量进行交互融合,得到一个融合矩阵,将所述融合矩阵输入到一个卷积神经网络中进行训练,得到第二次训练特征向量;
输出分类:将所述第二次训练特征向量依次进行第二次池化处理、拉平后输入到全连接层以及分类。
3.根据权利要求1所述的一种基于卷积神经网络的中文问答系统的属性选择方法,其特征在于,所述多种分词方式包括jieba分词工具、斯坦福中文分词器以及字符级分词器。
4.根据权利要求1所述的一种基于卷积神经网络的中文问答系统的属性选择方法,其特征在于,所述预处理包括:对分词后的问句去除标点符号、去停用词得到多个问句序列,对分词后的候选属性去除标点符号、去停用词得到多个候选属性序列。
5.根据权利要求4所述的一种基于卷积神经网络的中文问答系统的属性选择方法,其特征在于,所述映射包括:分别对所述多个问句序列和多个候选属性序列采用Word2Vec训练好的词向量进行映射。
6.根据权利要求2所述的一种基于卷积神经网络的中文问答系统的属性选择方法,其特征在于,进行所述第一次训练时,卷积核宽度和词向量宽度一致,卷积核在卷积时整行地进行卷积。
7.根据权利要求2所述的一种基于卷积神经网络的中文问答系统的属性选择方法,其特征在于,所述多个问句特征向量、多个候选属征向量的宽度均为1;所述总问句特征向量和总候选属性特征向量均为n行1列的矩阵,所述融合矩阵为n行n列的矩阵。
8.根据权利要求2所述的一种基于卷积神经网络的中文问答系统的属性选择方法,其特征在于,所述第一次池化处理、第二次池化处理均采用k-max池化。
9.根据权利要求2所述的一种基于卷积神经网络的中文问答系统的属性选择方法,其特征在于,所述拉平后输入到全连接层以及分类包括:使用ReLU函数作为全连接层的激活函数,并使用softmax分类器得到问句和候选属性的相似度。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有能够实现权利要求1-9中任意一项所述的一种基于卷积神经网络的中文问答系统的属性选择方法的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110210928.2/1.html,转载请声明来源钻瓜专利网。