[发明专利]基于分类检索的自动问答方法及系统在审
申请号: | 201711107543.3 | 申请日: | 2017-11-10 |
公开(公告)号: | CN107885844A | 公开(公告)日: | 2018-04-06 |
发明(设计)人: | 张昊;何硙卓;邵菲;程龚;瞿裕忠 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 南京天翼专利代理有限责任公司32112 | 代理人: | 奚铭 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分类 检索 自动 问答 方法 系统 | ||
技术领域
本发明属于计算机技术领域,涉及自然语言处理和自动问答技术,为一种基于分类检索的自动问答方法及其系统,特别是一种基于分类检索的面向中学地理简答类问题的中文自然语言自动问答方法。
背景技术
自然语言处理(natural language processing)是人工智能和语言学领域的分支学科,研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。处理自然语言的关键是要让计算机“理解”自然语言,从而使计算机可以与人交互。自然语言处理的关键技术包括中文分词、词性标注、句法分析、命名实体识别、指代消解、依存分析等。
问答系统(question answering system),基于信息检索技术和自然语言处理,能用准确、简洁的自然语言自动回答用户的自然语言问题。问答系统能够自动分析问题并给出相应的候选答案,传统的自动问答系统主要由问句分析、信息检索和答案生成等模块构成。
自动问答主要是面向文本集合进行的。首先分析问题中的关键词,然后通过关键词在文本库中进行检索,获取返回结果中确信度最高的前若干文档,再从中生成答案。
发明内容
本发明要解决的问题是:如何通过设定好的知识库,自动回答中学地理简答类问题这类特定领域、问句较为复杂、问题可分类、不同类别有相应的检索方法的问题。
本发明的技术方案为:一种基于分类检索的自动问答方法,通过计算机程序实现简答类问题的自动回答,所述简答类问题为包含多个子问题的复杂问句,包括以下步骤:首先对一个简答类问题进行中文自然语言处理生成句法树,所述中文自然语言处理包括分词、词性标注和句法分析,然后根据简答类问题中的关键动词和连词将包含多个子问题的复杂问句拆分为语义更明确的、只包含单个问题的简单问句;
预先设定问句模板,每个模板设有对应的触发词,所述问句模板指符合疑问句语法的问句模型,不同触发词对应不同类型的问句模板,模板设有相应的模板槽,模板槽用于填入该问句模板所需的关键信息;
使用问句模板所对应的触发词,对每个简单问句进行分类,并从简单问句中提取该问句模板所需的关键信息,对应模板设定的词类定义填入模板槽中,形成包含解题所需信息的问句模板;然后根据问句模板的类型,从相对应的模板知识库中,根据模板槽中的关键信息对应模板知识库中的关键字进行检索,得到若干候选答案;最后,从候选答案中选取最优答案,作为简单问题的答案,然后将所有简单问题的答案进行综合,得出最终答案。
得到简单问句后,对简单问句间的递进关系进行分析,在根据动词和连词进行问句拆分时,根据问句中的指代和拆分后的问句特征,判断子问题之间是否有递进关系,递进关系指前一个子问题的答案会作为后一个子问题的关键信息;若有递进关系,在使用前一个子问题答案作为关键信息的子问题中做上标记,在后续解题时使用前一个子问题答案的关键信息。
拆分简单问句包括以下步骤:
1.1)先对一个简答类问题通过自然语言处理技术对问句进行分词、词性标注、句法分析,得到句法树;
1.2)基于所述步骤1.1)得到的句法树,判断问句中是否存在多个关键动词,若存在,则根据关键动词将问句拆分成若干只包含一个关键动词的问句,否则无需根据关键动词进行问句拆分;
1.3)基于所述步骤1.2)得到的只包含一个关键动词的问句,通过句法树判断问句中是否存在通过连词连接组成的并列结构,若存在,则将并列结构取出,并根据并列结构中的连词拆分成若干不包含并列结构的问句,否则无需根据连词进行问句拆分;此步骤之后可将原问句拆分成只包含一个关键动词且不存在并列结构的若干简单问句。
从模板知识库中检索得到最终答案的过程如下:
2.1)模板知识库预先进行泛化,将其中的具体实体替换为该实体在该处所具有的关键特征,并将这些特征作为关键字帮助进行答案检索;
2.2)根据不同类型问句模板中模板槽的语义,在相应类型的模板知识库中将对应模板槽的某一列或某几列上建立索引;
2.3)基于所述步骤2.2)建立好索引的知识库,根据包含解题所需信息的问句模板,在相应的模板知识库中,使用问句模板中的关键信息作为关键词,根据模板槽的语义在对应的索引上进行检索,得到若干候选答案并按照相似度递减的顺序排列;
2.4)基于所述步骤2.3)得到的候选答案,每次选取相似度最高的前三个候选答案作为简单问句的答案;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711107543.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:转向传动轴连接结构
- 下一篇:应用于大型越野车的转向机构