[发明专利]一种层级对齐结构的问答立场检测方法及装置有效
申请号: | 202110230676.X | 申请日: | 2021-03-02 |
公开(公告)号: | CN113127599B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 付鹏;林政;刘欢;王伟平;孟丹 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06Q50/00 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 陈艳 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 层级 对齐 结构 问答 立场 检测 方法 装置 | ||
1.一种层级对齐结构的问答立场检测方法,其步骤包括:
1)分别将问题文本与回答文本转换为问题序列与回答序列;
2)拼接问题序列与回答序列,得到问题回答序列;
3)将问题序列、回答序列及问题回答序列输入层次对齐模型,得到问答立场检测结果;
其中,通过以下步骤获取问答立场检测模型:
a)分别将若干样本问题文本与若干样本回答文本转换为样本问题序列与样本回答序列,并拼接样本问题序列与相应的样本回答序列,得到若干样本问题回答序列;
b)分别编码各样本问题序列、样本回答序列及样本问题回答序列,得到若干的问题序列表示SQ、回答序列表示SA及粗粒度立场表示SQA;
c)以问题序列表示SQ作为查询且将相应的回答序列表示SA作为键和值,获取若干的依赖于问题的回答表示MQ→A,以回答序列表示SA作为查询且将相应的回答序列表示SQ作为键和值,获取若干的依赖于回答的问题表示MA→Q,并连接依赖于问题的回答表示MQ→A与相应的依赖于回答的问题表示MA→Q,得到若干细粒度表示,记作DQA;
d)基于多头注意力机制,对齐细粒度表示DQA与相应的粗粒度立场表示SQA之间证据相关的句子含义,得到若干的由粗到精立场向量表示O;
e)通过对若干的由粗到精立场向量表示O进行分类,获取层次对齐模型。
2.如权利要求1所述的方法,其特征在于,编码样本问题序列、样本回答序列及样本问题回答序列的方法包括:使用预训练BERT模型。
3.如权利要求1所述的方法,其特征在于,通过以下步骤获取依赖于问题的回答表示MQ→A:
1)以问题序列表示SQ作为查询且将相应的回答序列表示SA作为键和值,获取第一个回答-问题匹配块的输出,其步骤包括:
a)得到第i个头的输出其中是的维度,d为样本问题文本与样本回答文本转换为样本问题序列与样本回答序列的嵌入尺寸,h为头的数量,是可学习的参数,1≤i≤h;
b)拼接h个头的输出,并对拼接结果进行线性投影运算,得到运算结果MATT(SQ,SA)=[ATT1(SQ,SA),ATT2(SQ,SA),...,ATTh(SQ,SA)WO,其中是可学习的参数;
c)在问题序列表示SQ与运算结果MATT(SQ,SA)之间进行残差连接,得到结果Z=LN(SQ+MATT(SQ,SA)),其中LN为层次归一化操作;
d)将结果Z接入一个前馈网络与另一个残差连接层,得到第一个transformer编码器的输出TIM1(SQ,SA)=LN(Z+MLP(Z)),其中MLP为前馈网络;
2)通过堆积lm个回答-问题匹配块,获取依赖于问题的回答表示
4.如权利要求3所述的方法,其特征在于,由粗到精立场向量表示O=MATT′(DQA,SQA)=[ATT′1(DQA,SQA),...,ATT′h′(DQA,SQA)]W′O,其中是可学习的参数,1≤j≤h′,h′是注意力头的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110230676.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光栅式地铁隧道管片错台测量尺
- 下一篇:一种机械式地铁隧道管片错台测量尺