[发明专利]可解释的文本语义匹配方法、装置、电子设备及存储介质在审

专利信息
申请号: 202211592751.8 申请日: 2022-12-13
公开(公告)号: CN115905537A 公开(公告)日: 2023-04-04
发明(设计)人: 周倚文;张云云;何剑涛;魏志辉;张文锋;王福海 申请(专利权)人: 招联消费金融有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F16/33;G06F40/30;G06F18/22
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 肖腾蛟
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 可解释 文本 语义 匹配 方法 装置 电子设备 存储 介质
【说明书】:

本申请实施例公开了一种可解释的文本语义匹配方法、装置、电子设备及存储介质。该方法包括:获取待识别文本;对待识别文本和第一候选文本进行特征提取,得到多个第一候选文本片段和多个第一句子、多个第二候选文本片段和多个第二句子;对每个第一候选文本片段和每个第二候选文本片段进行关键词分析得到多个第一目标文本片段和多个第二目标文本片段;根据每个第一目标文本片段和每个第二目标文本片段得到每个第一目标文本片段对应的多个第一相似度;根据多个第一相似度、多个第一句子和多个第二句子,确定目标文本;将每个第一目标文本片段和目标文本中与每个第一目标文本片段所关联的第二目标文本片段确定为解释信息。

技术领域

本申请涉及人工智能技术领域,具体涉及一种可解释的文本语义匹配方法、装置、电子设备及存储介质。

背景技术

目前的语义匹配方法,一般上是分为三种实现范式:第一种是基于字符串的方法,只计算字符串的匹配程度,不考虑语义信息,通过计算句子之间的海明距离来判断文本是否相似;第二种是基于语料库的方法,将输入的句子进行分词,然后计算句子中每个词与其他句子的相似度,最后进行加权求和;第三种是基于深度学习的方法,可以将语义匹配问题直接视为一个二分类问题,类别可以分为“匹配”和“不匹配”,然后在预训练模型下进行微调,最后得到结果。

但是对长文本(即文本的字符数大于阈值)的语义匹配而言,基于现有的语义匹配方法,如深度学习算法,虽然最终的匹配结果可以判断两个长文本相似或者不相似,但是不能解释为什么这两个长文本相似或者不相似,使得用户对匹配结果不理解。因此,在长文本的语义匹配上如何增加用户对匹配结果的理解,进而提升用户的体验感是亟待解决的问题。

发明内容

本申请实施例提供了一种可解释的文本语义匹配方法、装置、电子设备及存储介质,通过确定出解释信息来解释待识别文本和目标文本相似的原因,增加了用户对匹配结果(即待识别文本语义匹配到最相似的文本是目标文本)的理解,进而提升了用户的体验感。

第一方面,本申请实施例提供一种可解释的文本语义匹配方法,该方法包括:

获取待识别文本,其中,待识别文本的字符数大于阈值;

对待识别文本进行特征提取,得到多个第一候选文本片段和多个第一句子;

对文本数据库中的第一候选文本进行特征提取,得到多个第二候选文本片段和多个第二句子,其中,第一候选文本为文本数据库中多个候选文本中的任意一个;

对每个第一候选文本片段进行关键词分析,得到多个第一目标文本片段;

对每个第二候选文本片段进行关键词分析,得到多个第二目标文本片段;

根据每个第一目标文本片段和每个第二目标文本片段,得到每个第一目标文本片段对应的多个第一相似度;

根据每个第一目标文本片段对应的多个第一相似度、多个第一句子和多个第二句子,从多个候选文本中确定出目标文本;

将每个第一目标文本片段和目标文本中与每个第一目标文本片段所关联的第二目标文本片段确定为解释信息,其中,与每个第一目标文本片段所关联的第二目标文本片段为该第一目标文本片段对应的多个第一相似度中最大的第一相似度所对应的第二目标文本片段,解释信息用于解释待识别文本和目标文本相似的原因。

第二方面,本申请实施例提供一种可解释的文本语义匹配装置,该装置包括:获取单元和处理单元;

获取单元,用于获取待识别文本,其中,待识别文本的字符数大于阈值;

处理单元,用于对待识别文本进行特征提取,得到多个第一候选文本片段和多个第一句子;

处理单元,用于对文本数据库中的第一候选文本进行特征提取,得到多个第二候选文本片段和多个第二句子,其中,第一候选文本为文本数据库中多个候选文本中的任意一个;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于招联消费金融有限公司,未经招联消费金融有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211592751.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top