[发明专利]关系感知相似问题识别评估方法、系统、设备及存储介质在审
申请号: | 202210047822.X | 申请日: | 2022-01-17 |
公开(公告)号: | CN114416947A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 陈恩红;刘淇;陈彦敏;王皓;黄振亚 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/289;G06F40/30;G06F16/35;G06Q30/02;G06N3/04;G06N3/08 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;韩珂 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关系 感知 相似 问题 识别 评估 方法 系统 设备 存储 介质 | ||
1.一种关系感知的相似问题识别评估方法,其特征在于,包括:
从数据集中提取多个语义关系情况下,相匹配的语义相关的问题数据,每一相匹配的语义相关的问题数据均为文本数据,包含验证问题对Qu与Qa,以及问题Qa对应的不同匹配关系下的多个语义相关的问题集合T;
构建基于关系感知神经网络相似问题识别模型,对每一相匹配的语义相关的问题数据进行联合表征,并利用获得的问题Qa的关系感知表示向量与问题Qu的表示向量进行识别评估,训练阶段,利用识别评估结果与识别标签构建损失函数,更新模型参数;
测试阶段,对于给定的问题对,利用训练后的基于关系感知神经网络相似问题识别模型进行识别评估。
2.根据权利要求1所述的一种关系感知的相似问题识别评估方法,其特征在于,所述从数据集中提取多个语义关系情况下,相匹配的语义相关的问题数据包括:
从收集到的数据中提取具有匹配相关的问题,每一问题都与其他多个问题构成相似问题匹配的关系,所述相似问题匹配的关系包含两种类别,第一种分类标签为1,表示两个问题具有相同的语义,属于语义匹配关系;第二种分类标签为0,表示两个问题具有相同的关键词,但语义不同,属于语义相似关系;
将提取出的问题划分为两部分:第一部分作为匹配问题知识库;另一部分作为验证模型的训练数据;提取训练数据中的问题Qu与匹配问题知识库中的单个问题Qa构成一个验证问题对,对于问题Qa,如果匹配问题知识库中的其他任意问题与Qa的分类标签为1,则将放入集合Tp,如果分类标签为0,则放入集合Tq;集合T={Tp,Tq}即为问题Qa对应的不同匹配关系下的多个语义相关的问题集合;
之后,对每一相匹配的语义相关的问题数据进行分词,获得验证问题对Qu与Qa的文本内容分词结果以及问题集合T中各问题的文本内容分词结果。
3.根据权利要求1所述的一种关系感知的相似问题识别评估方法,其特征在于,所述基于关系感知神经网络相似问题识别模型包括:问题表示层、关系感知表示层和问题识别评估层;其中:
所述问题表示层,用于提取每一验证问题对Qu与Qa的表示向量,以及问题Qa对应的不同匹配关系下的多个语义相关的问题集合中每一问题的表示向量;
所述关系感知表示层,用于结合问题Qa与问题集合T中每一问题的语义关系,获得问题Qa的关系感知表示向量;
所述问题识别评估层,用于利用问题Qu与问题Qa的表示向量,以及问题Qa的关系感知表示向量,对验证问题对Qu与Qa的语义关系进行识别评估。
4.根据权利要求3所述的一种关系感知的相似问题识别评估方法,其特征在于,所述问题表示层,对每个问题进行独立编码,生成问题的表示向量:
h=Sentence-BERT(Q)
其中,h为问题Q的表示向量;Sentence-BERT表示Sentence BERT模型;
对于验证问题对Qu与Qa通过问题表示层获得相应的表示向量hu与ha;对于问题集合T={Tp,Tq}通过问题表示层获得语义匹配关系向量集Hp和语义相似关系的向量集Hq;其中,集合Tp与Tq中的问题与Qa的分类标签分别为1与0,分类标签为1表示两个问题属于语义匹配关系,分类标签为0表示两个问题属于语义相似关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210047822.X/1.html,转载请声明来源钻瓜专利网。