[发明专利]一种基于自然语言实体关系的智能问答推理方法和系统在审
申请号: | 202110902862.3 | 申请日: | 2021-08-06 |
公开(公告)号: | CN113779211A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 李瑞轩;辜希武;吴小建;李玉华 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/289;G06N3/04;G06N3/08;G06N5/04 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 胡秋萍 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自然语言 实体 关系 智能 问答 推理 方法 系统 | ||
本发明公开一种基于自然语言实体关系的智能问答推理方法和系统,属于自然语言处理领域。包括:将语料库中每条语句进行分词、实体词提取;以自然语句作为实体关联的边,形成实体关系,对语料库中实体连接关系进行汇总,形成基于自然语言实体关系的语义网络数据库;设计基于BERT预训练语言模型和图神经网络的智能推理深度学习模型;以用户提交问题相关的实体连接图输入网络进行推理,通过多层感知机进行结果筛选给出最终答案。本发明通过任意给定的自然语言文本语料库自动构建实体关系数据库,避免通过人工介入手段进行实体提取和标注,并通过分析用户的复杂问句来自动发现和推理出答案,以帮助用户更快和更精准获得所需结果。
技术领域
本发明属于自然语言处理领域,更具体地,涉及一种基于自然语言实体关系的智能问答推理方法和系统。
背景技术
随着信息化产业的蓬勃飞速发展,人们对于各个领域的信息搜索和分析的需求也是与日俱增。面对互联网每日以惊人速度增长的信息和内容,如何从这些爆炸的信息中快速检索出人们想要的东西也变得愈发重要和迫切。这里面涉及到查询时的易用度和精准度的权衡:一方面,虽然可以设计和使用结构化的查询语言来精准描述自己的目标并快速获取到想要的结果,但是掌握并灵活地应用这些专业查询语言会使得学习成本陡然上升,因此并不适用于一般的用户和从业者;另一方面,使用常用的搜索引擎,人们可以用自然语言描述自己的问题并获取结果,这种检索方式简单且符合人类逻辑,但搜索引擎返回的结果往往是纷繁复杂、眼花缭乱的,包含很多冗余和错误的页面,要求查询者自己去遴选甄别出所需要的特定信息,这无疑增加了使用者的负担;更进一步的,由于用户检索时使用的是自然语言,这里面通常包含着复杂的语义内涵以及隐去了的常识性背景知识,而主流的搜索引擎一般都是基于关键词来完成内容检索任务,这进一步降低了搜索结果的准确率和召回率。
因此,一个理想的检索系统应该能同时具备简单易用和精准结果两个特性,而这正是智能问答系统所具备和要解决的。智能问答系统能够接受用户以自然语言输入的提问和描述,经过分析和推理后给出一个准确而简明的答案,而非冗杂的网页以供用户甄选,所以智能问答系统是比搜索引擎更为高效和易用的,也越来越受到多方的关注。此外在构建问答系统时需要额外的信息数据库提供问答决策支持。近年来一些产品化的问答系统也应运而生,例如Apple公司的Siri助手、Google公司的Google Now应用。智能问答利用自然语言处理(NLP)技术,能够充分理解用户提交的查询语句,深入挖掘其中信息之间的语义联系,然后更为精确地返还给用户理想的结果。
在这其中,语料库的构建和决策推理信息的生成也面临着一些问题和挑战:通常的语料信息库是搜集自各种网页文本,然后进行数据清洗和结构化处理,例如处理为典型的RDF三元组结构。高度结构化的语料库在结点检索时较方便,也有利于自动推理,但是其缺点是难以大规模生成和保持数据时效性的更新,且面对复杂语义的自然语言时不能够很好的采样出一个连接密集的网络化结构数据,特别是面对实际需求时更是捉襟见肘,面对这些巨量的数据也变得越来越不现实。由此推广至其他有类似需求的行业也是一样的,故而相关行业从业者也迫切希望能够借助人工智能技术来构建领域高效智能的信息处理系统以便能够把握行业动态、增加自己的竞争能力。
发明内容
针对现有技术的缺陷和改进需求,本发明提供了一种基于自然语言实体关系的智能问答推理方法和系统,其目的在于将海量的文本数据直接作为数据源,从其中自动生成问题相关的、基于自然语言实体连接关系的决策数据,并交由智能问答系统进行推理和给出准确结果。
为实现上述目的,按照本发明的第一方面,提供了一种基于自然语言实体关系的智能问答推理方法,所述方法包括:
一、实体关系语料库构建阶段:
对语料库中每一条语句进行分词操作;从分词后的语句中提取实体词;
以提取到的实体词为基础,若两个实体出现在同一自然语句中,则该条自然语句作为连接这两个实体的边,构成实体关系;对语料库中实体连接关系进行汇总,形成实体关系语料库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110902862.3/2.html,转载请声明来源钻瓜专利网。