[发明专利]一种知识图谱的问句生成方法、装置、设备和存储介质在审
申请号: | 202210566962.8 | 申请日: | 2022-05-24 |
公开(公告)号: | CN114925186A | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 王华珍;张恒彰;刘晓聪;汪晓凤;徐婷婷;李弼程;缑锦 | 申请(专利权)人: | 华侨大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 厦门智慧呈睿知识产权代理事务所(普通合伙) 35222 | 代理人: | 王玮婷 |
地址: | 362000 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 图谱 问句 生成 方法 装置 设备 存储 介质 | ||
1.一种知识图谱的问句生成方法,其特征在于,包含:
获取知识图谱;所述知识图谱包括子图集合,每个子图包括实体集合、关系集合和三元组集合;
根据所述知识图谱,通过图变换网络模型,获取各个子图的子图向量;
获取问句数据集;
根据所述知识图谱和所述问句数据集,基于相似度获取各个子图的外部问句;
获取五何问题类型参数;
根据所述五何问题类型参数和所述外部问句,通过BiLSTM神经网络模型,获取外部增强向量;
根据所述子图向量和所述外部增强向量,通过指针生成网络模型,获取问句。
2.根据权利要求1所述的知识图谱的问句生成方法,其特征在于,根据所述知识图谱,通过图变换网络模型,获取各个子图的子图向量,包括:
将子图的实体集合输入词向量模型,获取子图的实体向量集合;
将所述实体向量集合输入图注意力网络模型,获取各个实体的中间层向量其中,所述中间层向量的计算模型为:
式中,为实体e的中间层向量、ve为实体e的实体向量、∨表示将图注意力网络模型中的N个注意力头的信息进行串联、代表在第n个注意力头的注意力参数是图注意力网络模型中实体ei与实体ej的注意力参数、为第n头注意力头中的特征矩阵、为实体ej的实体向量、为实体ei的实体向量、WQ和WK为计算注意力参数的特征矩阵、为实体ei在知识图谱中的邻居节点集合;
根据所述各个实体的中间层向量,通过所述图注意力网络模型的正则化层和前馈神经网络层,获取各个实体的输出向量表示其中,所述输出向量表示的计算模型为:
FFN(x)=W1×(f(W2×x+b1)+b2)
式中,为实体e的输出向量表示、LayerNorm为归一化函数、v’e为实体e的中间层向量经过LayerNorm函数及前馈神经网络层FFN得到的隐层向量、W1以及W2是前馈神经网络中的特征矩阵、x代表前馈神经网络层的输入信息、b1以及b2为偏置值;
根据所述各个实体的输出向量表示,得到子图的所述子图向量,从而获取各个子图的子图向量。
3.根据权利要求1所述的知识图谱的问句生成方法,其特征在于,根据所述知识图谱和所述问句数据集,基于相似度获取各个子图的外部问句,包括:
将子图的关系集合输入到PaddleNLP“解语”模型,获取关系词类标注信息集合;
将所述问句数据集输入到PaddleNLP“解语”模型,获取问句词类标注信息集合;
计算所述问句词类标注信息集合中的各个词类标注信息和所述关系词类标注信息集合的相似度其中,相似度计算模型为:
式中,代表关系词类标注信息与问句词类标注信息pbq的交集的词类标注信息个数、代表关系词类标注信息与问句词类标注信息pbq的并集的词类标注信息个数;
根据所述相似度,获取子图与所述问句数据集的相似度集合;
将所述相似度集合中最大的相似度所对应的问句作为子图的外部问句,从而获取各个子图的外部问句。
4.根据权利要求1所述的知识图谱的问句生成方法,其特征在于,根据所述五何问题类型参数和所述外部问句,通过BiLSTM神经网络模型,获取外部增强向量,包括:
根据所述五何问题类型参数和所述外部问句,通过词向量模型,获取五何问题类型向量和第一分词向量集合;
将所述第一分词向量集合中的各个词向量和所述五何问题类型向量进行向量纵向拼接,获取拼接词向量集合;
将所述拼接词向量集合输入BiLSTM神经网络模型,获取外部增强向量集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210566962.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种精巧扁脑珊瑚微卫星位点及应用
- 下一篇:一种棒材卸料设备及其控制方法