[发明专利]引入农业领域知识的抽取式智能问答方法及系统在审
申请号: | 202011529017.8 | 申请日: | 2020-12-22 |
公开(公告)号: | CN112527999A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 任妮;沈耕宇;郭婷;鲍彤;刘家祥;王坚强 | 申请(专利权)人: | 江苏省农业科学院 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289 |
代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 蔡兴兵 |
地址: | 210014 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 引入 农业 领域 知识 抽取 智能 问答 方法 系统 | ||
本发明公开了一种引入农业领域知识的抽取式智能问答方法及系统,抽取式智能问答方法包括以下步骤:S1、获取技术文章,构建文档资源库;S2、检索文档资源库中与问题相关的关联文档,并构建问题文章组合对数据;S3、根据问题文章对进行问句与文章预训练语言模型Bert编码;S4、将知识图谱数据嵌入Bert模型;S5、将问句与文章编码向量进行自注意力交互层运算,并将问句与文章编码向量与自注意力交互向量进行拼接,得到拼接后的关系向量;S6、将拼接后的关系向量作为答案预测层的输入向量,进行答案位置的预测,并将答案输出给用户。本发明的抽取式智能问答方法,有效提高了抽取式机器阅读理解模型在智能问答过程中答案抽取的准确率。
技术领域
本申请涉及农业技术中的机器阅读理解领域,更具体地,涉及一种引入农业领域知识的引入农业领域知识的抽取式智能问答方法及系统。
背景技术
机器阅读理解技术伴随着机器学习和深度学习技术的发展,取得了广泛的关注和投入,随着研究的深入出现了各种类型的机器阅读理解研究任务,从简单的完形填空式,再到复杂的抽取式问答任务,衡量机器阅读理解模型性能的各类评测数据集也被不断发布。
抽取式机器阅读理解问答的形式是根据给定的一篇文章,和针对文章提出一个问题,经过机器阅读理解模型的分析,返回文章内的一段文本作为所提问题的答案。因为问题的答案抽取自给定的文章内,因此称为抽取式机器阅读理解问答。智能问答研究是信息检索领域的一种更新颖和更智能的研究方向,它可以解决搜索引擎这类检索式问答无法获取更直接和精准信息的问题。机器阅读理解技术与智能问答相结合,是未来智能问答技术发展的主要研究方向。
目前随着互联网技术与农业相结合的越来越密切,互联网上产生了大量的农业领域知识,例如农业病虫害防治、农事操作等方面信息很容易通过搜索引擎检索到。面对这些分散在互联网各个角落的信息,研究人员通过深度学习技术和知识图谱技术,按照领域分别挖掘和整理出了相关农业领域的知识,并构建出了各种农业领域的知识图谱,比如番茄领域知识图谱、甘薯领域知识图谱等等。
在农业领域智能问答技术研究方面,领域知识图谱的应用还未成熟,而且那些已有的应用研究往往是在建立好的农业领域知识图谱基础上,直接利用基于知识库检索问答的方法去解决农业领域的智能问答。这种知识检索问答的形式返回给用户的答案由于是来源于知识图谱中整理好的结构化知识,虽然在答案准确性上有一定的保证,但是在农业领域的问答过程,用户大多会提出一些需要知道原因和办法的描述性的问题。这时仅仅通过知识库问答的方法很难实现对这种问题的准确回答。
在开放领域智能问答研究中抽取式机器阅读理解技术依托大量的人工标注生成了大量的问答对数据,从而为模型训练提供了充分的训练数据,能够轻松的在开放领域问答测评任务中取得较高得分。但是在农业领域,限于专业性的要求和领域文本资源的限制,首先很难开展类似的海量问答对数据标注工作,其次,针对某一具体农业领域有限的训练数据情况下,通过单一的阅读理解问答模型实现较好的效果是不可能的,必须依赖领域知识的引入,才能为农业领域智能问答模型提供较高的准确率。
发明内容
本申请的一个目的是提供一种引入农业领域知识的抽取式智能问答方法的新技术方案,能够解决现有的智能问答技术中存在准确率不高的问题。
根据本发明第一方面实施例,提供了一种引入农业领域知识的抽取式智能问答方法,包括以下步骤:
S1、获取技术文章,构建基于所述技术文章的文档资源库;
S2、针对用户提出的问题,检索所述文档资源库中与所述问题相关的关联文档,并构建问题文章组合对数据;
S3、根据所述问题文章组合对数据进行问句与文章预训练语言模型Bert编码,得到编码后的隐藏层编码向量,并将所述隐藏层编码作为问题文章组合对数据的初始编码;
S4、构建知识图谱数据,将所述知识图谱数据嵌入Bert模型,获得知识表示向量,并将所述知识表示向量与所述初始编码合并后输出问句与文章编码向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省农业科学院,未经江苏省农业科学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011529017.8/2.html,转载请声明来源钻瓜专利网。