[发明专利]一种基于深层卷积神经网络的自然语言问答方法有效
申请号: | 201710841026.2 | 申请日: | 2017-09-18 |
公开(公告)号: | CN107832326B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 来雨轩;冯岩松;贾爱霞;赵东岩 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/30;G06F40/284;G06N3/04 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深层 卷积 神经网络 自然语言 问答 方法 | ||
本发明公开一种基于深层卷积神经网络的自然语言问答方法。该方法包括以下步骤:1)将自然语言问题和数据库信息集中的信息表示成具有序列结构的向量,并形成向量矩阵;2)采用深层卷积神经网络对向量矩阵进行处理,提取对应的深层语义特征;3)根据深层语义特征计算自然语言问题与数据库信息集中的信息的语义相关度;4)根据计算得出的语义相关度选择数据库信息集中的信息,生成自然语言问题的回答。本发明可以更好地提取深层概括的语义特征,精准定位支持数据信息,从而可以取得更好的自然语言问答效果。
技术领域
本发明涉及一种利用深层卷积神经网络提取自然语言问题与候选信息的语义特征,以增强相关度计算的效果,从而提高自然语言问答准确性的方法,属于自然语言问答领域。
背景技术
随着信息技术和互联网的发展,信息过载越来越严重,如何有效地理解用户的需求,跨越查询到已有信息之间的不一致性鸿沟,从而有效地从大量的信息中获取用户所需,便成为一项非常重要的问题。
用户的查询通常表现为一个使用自然语言表达问题。而提供回答信息的资源数据库的表现形式可以有很多种,可以是由形如(主体,谓词,客体)的三元组构成结构化知识库,比如(中国,首都,北京)这条三元组就蕴含了“中国的首都是北京”这条知识;也可以是由大量普通自然语言句子构成的文本集,语料可能来自百科全书、新闻、社交媒体等多种平台及其组合,比如“我来到中国的首都——北京——读大学。”同样也蕴含了中国的首都是北京这条知识;同样的,资源数据库也可以是由多条多种形式的信息的组合构成的。自然语言问答中一个重要的过程就是评价资源数据库中的信息与用户查询的问题之间的语义相关度,从而选取最有效的信息来帮助回答用户问题。
自然语言问题通常具有灵活多变的特点,而资源数据库中信息的组织形式也很复杂,有效地提取特征以计算候选信息与自然语言问题之间的语义相关程度就成为了一项富有挑战性的任务。卷积神经网络可以自动组织临近词间的结构,提取文本的整体语义特征,抽象概括语义信息。而深层卷积神经网络具有更深的层数与更复杂的结构,可以以较少的参数整体处理较大的输入窗口内的语义并将其建模成更深层更抽象的特征表示,有助于更好地处理自然语言问题与候选信息组织形式的复杂性及其间表述不一致等问题,更好地在统一的特征空间中表达问题与候选信息的语义,从而更好地计算其间的语义相关度,以提高自然语言问答的准确性。
发明内容
本发明的目的是提供一个更好地提取自然语言问题与候选信息的语义特征以辅助计算其间的语义相关性从而提升自然语言问答准确率的一种方法。即对于自然语言问题q及数据库信息集D={Di}。使用深度神经网络的方法提取出其对应的特征向量:和并据此计算出问题q与每条数据库信息Di之间的相似度S={Sqi},并以此为依据选择与问题最相关的若干条信息,并据此生成问题的回答。
为了达到上述目的,本发明的技术方案为:
一种基于深层卷积神经网络的自然语言问答方法,包括以下步骤:
1)将自然语言问题和数据库信息集中的信息表示成具有序列结构的向量,并形成向量矩阵;
2)采用深层卷积神经网络对向量矩阵进行处理,提取对应的深层语义特征;
3)根据深层语义特征计算自然语言问题与数据库信息集中的信息的语义相关度;
4)根据计算得出的语义相关度选择数据库信息集中的信息,生成自然语言问题的回答。
其中,步骤1)所述数据库信息集是原始数据库信息集,或者是经过信息筛选得到的缩小范围后的候选信息集。
下面进一步说明本发明方法的具体步骤:
(1)对每个问题q与全体数据库信息集D,通过一些诸如检索等低开销手段缩小有效信息的范围并对筛选后的结果进行初步的排序,得到缩小范围的候选信息集
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710841026.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种POI数据校验方法与设备
- 下一篇:一种耐张线夹破坏载荷试验用夹具