[发明专利]一种结合知识库中的三元组和实体类型的生成问题方法在审
申请号: | 202010872496.7 | 申请日: | 2020-08-26 |
公开(公告)号: | CN112115687A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 蔡毅;徐静云 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/284;G06F40/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 知识库 中的 三元 实体 类型 生成 问题 方法 | ||
本发明公开了一种结合知识库中的三元组和实体类型的生成问题方法,所述方法一种基于注意力机制的神经网络模型:所述神经网络模型的输入为表示重构过的三元组的词向量序列,输出是通过处理词向量序列得到的一组用来表示问题的词向量序列。首先,利用三元组中的头实体和尾实体对应的实体类型对三元组进行重构,然后利用预训练好的Glove词嵌入获得表示重构得到的新三元组的词向量序列,之后利用一个基于注意力机制的门机制循环神经网络编码输入的词向量序列,再利用另一个基于注意力机制的门机制循环神经网络解码通过编码器得到的三元组的表示,最后处理解码器输出的词向量序列得到生成的问题。本发明结合了知识库中的三元组及三元组中的头实体和尾实体对应的实体类型的信息,通过一种基于注意力机制的神经网络模型得到一个语法上更流畅、与输入的三元组更相关的问题。
技术领域
本发明涉及自然语言处理技术中自然语言文本生成领域,具体涉及一种结合知识库中的三元组和实体类型的生成问题方法。
背景技术
问题生成是自然语言处理领域极一项重要的任务,近年来关于文本生成中的问题生成的的研究越来越多,根据数据源的不同,现有的方法可以分为基于知识库的问题生成,基于文本的问题生成,基于图像和文本的问题生成。
目前长短时记忆网络模型(Serban I V,Garcia-Duran A,Gulcehre C,etal.Generating Factoid Questions With Recurrent Neural Networks:The 30MFactoid Question-Answer Corpus[C]//Proceedings of the 54th Annual Meeting ofthe Association for Computational Linguistics(Volume 1:Long Papers).2016:588-598.)和注意力机制模型(Liu C,Liu K,He S,et al.Generating Questions forKnowledge Bases via Incorporating Diversified Contexts and Answer-Aware Loss[C]//Proceedings of the 2019Conference on Empirical Methods in NaturalLanguage Processing and the 9th International Joint Conference on NaturalLanguage Processing(EMNLP-IJCNLP).2019:2431-2441.)也在广泛使用。使用在自然语言文本生成的神经模型是基于序列到序列(seq2seq)模型,大部分研究也都是基于seq2seq模型进行修改。其主要思路是利用序列到序列模型来捕捉上下文的情节走向,对上下文的内容进行建模,在对上下文建模时会加入额外的知识信息来捕捉一些隐藏的有用信息,以期能够生成符合上下文情节的问题。Serban等人首次提出利用循环神经网络来生成事实性的问题(Serban I V,Garcia-Duran A,Gulcehre C,et al.Generating Factoid QuestionsWith Recurrent Neural Networks:The 30M Factoid Question-Answer Corpus[C]//Proceedings of the 54th Annual Meeting of the Association for ComputationalLinguistics(Volume 1:Long Papers).2016:588-598.),基于此,Indurthi等人提出利用循环神经网络来生成问题-答案对(Indurthi S R,Raghu D,Khapra M M,etal.Generating natural language question-answer pairs from a knowledge graphusing a RNN based question generation model[C]//Proceedings of the 15thConference of the European Chapter of the Association for ComputationalLinguistics:Volume 1,Long Papers.2017:376-385.),Liu等人提出了现有的基于知识库的问题生成领域(Liu C,Liu K,He S,et al.Generating Questions for KnowledgeBases via Incorporating Diversified Contexts and Answer-Aware Loss[C]//Proceedings of the 2019Conference on Empirical Methods in Natural LanguageProcessing and the 9th International Joint Conference on Natural LanguageProcessing(EMNLP-IJCNLP).2019:2431-2441.)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010872496.7/2.html,转载请声明来源钻瓜专利网。