[发明专利]一种文本匹配方法、装置、计算机设备及存储介质在审
申请号: | 202010914259.2 | 申请日: | 2020-09-03 |
公开(公告)号: | CN112052683A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 赵知纬;高维国 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06K9/62;G06F17/16;G06F17/18 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 武志峰 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 匹配 方法 装置 计算机 设备 存储 介质 | ||
本发明公开了一种文本匹配方法、装置、计算机设备及存储介质,涉及人工智能技术领域,方法包括:构建问句特征词集合QU和文本特征词集合QC,以及术语集合T;进行向量化处理得到特征向量QE以及术语向量TE;进行线性转换得到键矩阵K、查询矩阵Q和值矩阵V,以及矩阵KT;计算非归一化权重矩阵AQT,然后进行自我相乘以及归一化处理得到多个子矩阵;对所述多个子矩阵进行平均化处理,再进行归一化处理得到影响矩阵对所述键矩阵K和查询矩阵Q进行矩阵乘法,得到自注意力矩阵A,然后计算得到自注意力模块的输出,再根据所述输出进行匹配。本发明实现着重于已知的术语之间的匹配,减少非术语之间的匹配,达到提高匹配准确度的效果。
技术领域
本发明涉及人工智能技术领域,特别涉及一种文本匹配方法、装置、计算机设备及存储介质。
背景技术
近年来,基于transformer(Google团队在2017年提出的一种NLP经典模型)架构和海量数据的BERT(Bidirectional Encoder Representation from Transformers和基于Transformer的双向编码器表征)模型在各种NLP(自然语言处理)应用中大放光彩。BERT本身支持两段文本输入的设计使得其能够很容易地应用与文本匹配任务。在智能问答的实际应用中,对每个用户问句来说,不同的词或短语,其重要性不同,这些比较重要的词、短语称为术语,往往与实际业务相关。
但现有的处理方法,并未融合术语的重要性,比如用户问句为“XX公司现在有多少员工”,待匹配文本为“XX公司的薪酬福利体系是什么样的”,那么两者之间的“XX”一词也会有较大的注意力权重。而对待匹配文本来说,匹配上“薪酬”或者“福利”远比匹配上“XX”重要,故现有技术中的文本匹配方法在准确性方面还有待提高。
发明内容
本发明的目的是提供一种文本匹配方法、装置、计算机设备及存储介质,旨在解决现有文本匹配技术在准确性方面有待提高的问题。
第一方面,本发明实施例提供一种基于术语增强的文本匹配方法,其包括:
获取用户问句以及待匹配文本,对所述用户问句以及待匹配文本进行自然语言处理,分别得到问句特征词集合QU和文本特征词集合QC,并识别出所述问句特征词集合QU和文本特征词集合QC中的术语,构建术语集合T;
对所述问句特征词集合QU和文本特征词集合QC进行拼接,然后进行向量化处理,得到特征向量QE;以及对所述术语集合T进行向量化处理,得到术语向量TE;
对所述特征向量QE进行线性转换得到:键矩阵K、查询矩阵Q和值矩阵V,以及对所述术语向量TE进行线性转换,得到矩阵KT;
计算所述矩阵KT与查询矩阵Q的非归一化权重矩阵AQT,然后对所述非归一化权重矩阵AQT进行自我相乘以及归一化处理得到多个子矩阵;
对所述多个子矩阵进行平均化处理,再进行归一化处理得到影响矩阵
对所述键矩阵K和查询矩阵Q进行矩阵乘法处理,得到自注意力矩阵A,然后利用所述自注意力矩阵A和影响矩阵计算得到自注意力模块的输出,再根据所述输出对所述用户问句与待匹配的文本进行匹配。
第二方面,本发明实施例提供一种基于术语增强的文本匹配装置,其包括:
集合构建单元,用于获取用户问句以及待匹配文本,对所述用户问句以及待匹配文本进行自然语言处理,分别得到问句特征词集合QU和文本特征词集合QC,并识别出所述问句特征词集合QU和文本特征词集合QC中的术语,构建术语集合T;
向量化单元,用于对所述问句特征词集合QU和文本特征词集合QC进行拼接,然后进行向量化处理,得到特征向量QE;以及对所述术语集合T进行向量化处理,得到术语向量TE;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010914259.2/2.html,转载请声明来源钻瓜专利网。