[发明专利]基于多角度交互的中文句子对语义智能匹配方法和装置在审
申请号: | 202111490833.7 | 申请日: | 2021-12-08 |
公开(公告)号: | CN114238563A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 鹿文鹏;张国标;阚保硕;马凤英;左有慧;赵鹏宇 | 申请(专利权)人: | 齐鲁工业大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/04;G06N3/08 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250353 山东省济南*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 角度 交互 中文 句子 语义 智能 匹配 方法 装置 | ||
本发明公开了基于多角度交互的中文句子对语义智能匹配方法和装置,属于人工智能领域。本发明要解决的技术问题为如何捕捉句子内部不同粒度的交互特征以及句子之间同一粒度的交互特征,以实现中文句子对语义的智能匹配。采用的技术方案为:构建由多粒度编码模块、多角度交互模块、预测模块组成的中文句子对语义智能匹配模型;首先使用BiLSTM在字符和词语粒度上进行编码,而后利用注意力机制以及残差连接获得句内交互最终表示和句间交互最终表示,并提取关键特征生成两个句子的最终表示,最后通过多层感知机预测语义匹配度。该装置包括中文句子对语义匹配知识库构建单元、训练数据集生成单元、语义匹配模型构建单元以及语义匹配模型训练单元。
技术领域
本发明属于人工智能、自然语言处理技术领域,具体涉及一种基于多角度交互的中文句子对语义智能匹配方法和装置。
背景技术
句子对语义匹配是指判断两个句子所包涵的语义信息是否相似,其直接影响众多下游自然语言处理应用的性能,如检索式对话机器人和自动问答系统等。中文句子对语义匹配任务旨在衡量两个中文句子对所蕴含的语义是否一致。现有的大多数句子对语义匹配工作都集中在英文上,其往往仅试图在单词粒度上捕获语义特征。然而,中文不同于英文,中文句子的语义可以在字符粒度和词语粒度上进行表征,其语义特征的充分捕获更加困难。现有的英文句子对语义匹配方法并不能满足中文句子对语义匹配的需要。
尽管已有少量工作尝试将字符粒度和词语粒度等多角度的特征结合起来,用于中文文本建模。但是,这些工作通常仅使用一些简单的操作(拼接或求和)将不同粒度的文本嵌入表示结合在一起。这些简单方法无法捕获句子内部不同粒度、句子之间同一粒度的交互特征,导致性能改进有限。为了捕获中文句子对之间更复杂的语义交互特征,近年来出现了一些基于交互模型的工作,例如堆叠多层卷积网络等。然而,这些工作仍然无法彻底解决中文句子对语义匹配任务中的问题,因为它们缺乏从多个角度捕获交互特征的能力,包括句子内部不同粒度的交互特征和句子之间同一粒度的交互特征。
发明内容
针对现有的中文句子对语义匹配方法的不足,本发明提出了一种基于多角度交互的中文句子对语义智能匹配方法和装置。该方法和装置,将句子在字符粒度和词语粒度上进行切分,设计多粒度编码层,将其转化为相应的嵌入表示,而后使用BiLSTM长短期记忆网络对嵌入表示进行编码;设计多角度交互层来建模句子内部不同粒度、句子之间同一粒度的交互特征;使用注意力机制以及残差连接,避免交互信息丢失并增强句子表示;使用全局平均池化和最大池化来提取句内交互最终表示和句间交互最终表示的关键特征,从而生成两个句子的最终表示;设计预测层,利用多层感知机预测句子对的语义匹配度。本发明提出了多角度交互模型,该模型可以获得句内交互最终表示和句间交互最终表示,即句子内部不同粒度、句子之间同一粒度的交互特征。其核心思想是将多粒度编码层生成的句子的初始上下文表示作为输入,使用注意力机制以及残差连接获得句内交互最终表示和句间交互最终表示,之后使用全局平均池化和最大池化来提取句内交互最终表示和句间交互最终表示的关键特征,从而生成两个句子的最终表示,提高语义匹配的整体效果。具体如下:
多粒度编码模块接收以字符粒度和词语粒度切分的句子,并转化为相应的嵌入表示,然后使用BiLSTM长短期记忆网络对嵌入表示进行编码生成句子的初始上下文表示,并将句子的初始上下文表示传递给多角度交互模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111490833.7/2.html,转载请声明来源钻瓜专利网。