[发明专利]一种文本匹配方法、装置、系统以及存储介质在审
申请号: | 202310077974.9 | 申请日: | 2023-02-07 |
公开(公告)号: | CN116303887A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 蔡晓东;董丽芳 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 赖定珍 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 匹配 方法 装置 系统 以及 存储 介质 | ||
1.一种文本匹配方法,其特征在于,包括如下步骤:
导入多个句子对以及与各个所述句子对一一对应的关键字信息对和意图信息对,并对各个所述句子对、各个所述句子对所对应的关键字信息对以及意图信息对进行编码,得到各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对;
根据各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对进行交互向量的分析,得到各个所述句子对的交互向量;
根据各个所述句子对的交互向量进行得分向量的计算,得到各个所述句子对的多个得分向量;
根据各个所述句子对的多个得分向量进行文本匹配准确率的分析,得到文本匹配准确率,并将所述文本匹配准确率作为文本匹配的结果。
2.根据权利要求1所述的文本匹配方法,其特征在于,所述句子对包括第一句子和第二句子,所述关键字信息对包括与所述第一句子对应的关键字信息以及与所述第二句子对应的关键字信息,所述意图信息对包括与所述第一句子对应的意图信息以及与所述第二句子对应的意图信息;
所述对各个所述句子对、各个所述句子对所对应的关键字信息对以及意图信息对进行编码,得到各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对的过程包括:
通过文本编码器对各个所述第一句子、各个所述第二句子、各个所述第一句子所对应的关键字信息和意图信息以及各个所述第二句子所对应的关键字信息和意图信息进行编码,对应得到各个所述第一句子的句子原始向量、各个所述第二句子的句子原始向量、各个所述第一句子所对应的关键字向量和意图向量以及各个所述第二句子所对应的关键字向量和意图向量;
所述句子对的句子原始向量对包括所述第一句子的句子原始向量和所述第二句子的句子原始向量;
所述句子对所对应的关键字向量包括所述第一句子所对应的关键字向量和所述第二句子所对应的关键字向量;
所述句子对所对应的意图向量对包括所述第一句子所对应的意图向量和所述第二句子所对应的意图向量。
3.根据权利要求2所述的文本匹配方法,其特征在于,所述根据各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对进行交互向量的分析,得到各个所述句子对的交互向量的过程包括:
根据各个所述第一句子的句子原始向量、各个所述第二句子的句子原始向量、各个所述第一句子所对应的关键字向量和意图向量以及各个所述第二句子所对应的关键字向量和意图向量进行聚合分析,得到各个所述第一句子的聚合向量以及各个所述第二句子的聚合向量;
对各个所述第一句子的句子原始向量和聚合向量以及各个所述第二句子的句子原始向量和聚合向量进行拼接,对应得到各个所述第一句子的融合向量以及各个所述第二句子的融合向量;
基于第一式,根据各个所述第一句子的融合向量以及各个所述第二句子的融合向量进行交互向量的计算,得到各个所述句子对的交互向量,所述第一式为:
output_crossingi=CrossingLayer(output_con_ai,output_con_bi),
其中,output_crossingi为第i个句子对的交互向量,CrossingLayer()为交叉层函数,output_con_ai为第i个第一句子的融合向量,output_con_bi为第i个第二句子的融合向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310077974.9/1.html,转载请声明来源钻瓜专利网。