[发明专利]关系感知相似问题识别评估方法、系统、设备及存储介质在审
申请号: | 202210047822.X | 申请日: | 2022-01-17 |
公开(公告)号: | CN114416947A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 陈恩红;刘淇;陈彦敏;王皓;黄振亚 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289;G06F40/30;G06F16/35;G06Q30/02;G06N3/04;G06N3/08 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;韩珂 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关系 感知 相似 问题 识别 评估 方法 系统 设备 存储 介质 | ||
本发明公开了一种关系感知相似问题识别评估方法、系统、设备及存储介质,相关方案使用基于关系感知神经网络相似问题识别模型来进行问题对的相似问题识别,相比于传统模型,使用了多个语义匹配的语义关系相关信息。对于预测的结果,在多个评价指标上有一定的提高。
技术领域
本发明涉及自然语言处理领域,尤其涉及一种关系感知相似问题识别评估方法、系统、设备及存储介质。
背景技术
相似问题识别是智能客服问答研究领域的一个核心问题。当用户提出一个新问题,智能客服需要对用户的新问题进行理解,找到和用户问题可能匹配的相似问题,通过匹配模型得到最匹配的问题,反馈给用户相应的答案。因此用户相似问题识别任务也可以建模为相似文本匹配任务。相似问题识别任务应用在很多领域,例如在社区问答查询,信息检索和智能客户服务系统等,都将相似问题识别作为该应用领域的核心问题来研究。因此如何解决相似问题识别已成为一个非常重要的基础问题。
围绕这个研究课题,研究者们提出了多种解决方法,大部分相关的研究主要集中在两个问题之间的词法、句法或问题结构,通过建模两个问题的语义关系,来判断两个问题的相似程度。
然而由于问题长度较短和自然语言表达的灵活性和宽泛性,相似问题匹配面临着多样性的挑战。为了解决问题的多样性,部分的研究是引入外部知识例如知识图谱,问题答案等方法,用来解决多样性不足的情况。但是这些外部知识包含范围领域广泛或者针对性不强,并不能完全符合问题多样性表达的补充,因此,识别准确度还有待提升。
发明内容
本发明的目的是提供一种关系感知相似问题识别评估方法、系统、设备及存储介质,可以充分利用多个问题对之间的语义关系信息来解决问题之间的相似问题识别,并具有较高的预测精度。
本发明的目的是通过以下技术方案实现的:
一种关系感知的相似问题识别评估方法,包括:
从数据集中提取多个语义关系情况下,相匹配的语义相关的问题数据,每一相匹配的语义相关的问题数据均为文本数据,包含验证问题对Qu与Qa,以及问题Qa对应的不同匹配关系下的多个语义相关的问题集合T;
构建基于关系感知神经网络相似问题识别模型,对每一相匹配的语义相关的问题数据进行联合表征,并利用获得的问题Qa的关系感知表示向量与问题Qu的表示向量进行识别评估,训练阶段,利用识别评估结果与识别标签构建损失函数,更新模型参数;
测试阶段,对于给定的问题对,利用训练后的基于关系感知神经网络相似问题识别模型进行识别评估。
一种关系感知的相似问题识别评估系统,用于实现前述的方法,该系统包括:
数据提取单元,用于从数据集中提取多个语义关系情况下,相匹配的语义相关的问题数据,每一相匹配的语义相关的问题数据均为文本数据,包含验证问题对Qu与Qa,问题Qa以及问题Qa对应的不同匹配关系下的多个语义相关的问题集合T;
模型构建与训练单元,用于构建基于关系感知神经网络相似问题识别模型,对每一相匹配的语义相关的问题数据进行联合表征,并利用获得的问题Qa的关系感知表示向量与问题Qu的表示向量进行识别评估,训练阶段,利用识别评估结果与识别标签构建损失函数,更新模型参数;
识别评估测试单元,用于对于给定的问题对,利用训练后的基于关系感知神经网络相似问题识别模型进行识别评估。
一种处理设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210047822.X/2.html,转载请声明来源钻瓜专利网。