[发明专利]神经语义编解码分析方法及系统在审
申请号: | 202011102971.9 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112232084A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 王少楠;孙静远;张家俊;宗成庆 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/126;G06N3/04;G06N3/08 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经 语义 解码 分析 方法 系统 | ||
1.一种神经语义编解码分析方法,其特征在于,所述神经语义编解码分析方法包括:
训练回归模型拟合脑神经激活水平与文本刺激的向量表示之间的映射关系,建立文本表示模型;
通过探针任务量化解析文本表示模型描述各类语言特征的能力,得到探针任务表现;
根据探针任务表现,通过消融任务以调整文本表示模型;
在调整后的文本表示模型生成的句子向量的基础上来执行分析任务。
2.根据权利要求1所述的神经语义编解码分析方法,其特征在于,所述文本表示模型包括神经编码器模型及神经解码器模型;
所述训练回归模型拟合脑神经激活水平与文本刺激的向量表示之间的映射关系,建立文本表示模型,具体包括:
获取训练样本集,所述训练样本集中的训练样本包括功能性核磁共振图像样本及对应的文本刺激、体素矩阵、句子表示矩阵;
根据所述功能性核磁共振图像及对应刺激表示的维度初始化回归模型,设置网络参数;
基于初始化的回归模型,根据体素矩阵及句子表示矩阵,分别得到神经编码器模型及神经解码器模型。
3.根据权利要求2所述的神经语义编解码分析方法,其特征在于,所述根据体素矩阵及句子表示矩阵,得到神经编码器模型,具体包括:
通过最小化第一目标函数,得到神经编码器模型的回归系数We:
第一目标函数为:
其中,λ为正则化参数,Ze表示句子表示矩阵,NE表示训练样例数,NV表示体素的数量,ND表示句子表示的维数;xi表示体素矩阵,表示二范数、||.||1表示一范数
基于初始化的回归模型,根据神经编码器模型的回归系数We,确定神经编码器模型,神经编码器模型从句子表示中学习预测大脑活动。
4.根据权利要求2所述的神经语义编解码分析方法,其特征在于,所述根据体素矩阵及句子表示矩阵,得到神经解码器模型,具体包括:
通过最小化第二目标函数,得到神经解码器模型的回归系数Wd:
第二目标函数为:
其中,λ为正则化参数,NE表示训练样例数,NV表示体素的数量,ND表示句子表示的维数,X表示体素矩阵,zi表示句子表示矩阵,表示二范数、||.||1表示一范数;
基于初始化的回归模型,根据神经解码器模型的回归系数Wd,确定神经解码器模型;所述神经解码器模型通过直接从体素估计语义向量来进行的,每个维度都由单独的回归模型预测。
5.根据权利要求2所述的神经语义编解码分析方法,其特征在于,所述探针任务包括语义探针任务、句法探针任务和形态学探针任务中至少一者;
所述通过探针任务量化解析文本表示模型描述各类语言特征的能力,得到探针任务表现,具体包括:
通过语义探针任务量化解析文本表示模型描述语义特征的能力;通过句法探针任务量化解析文本表示模型描述句法结构特征的能力;通过形态学探针任务量化解析文本表示模型描述句法形态特征的能力。
6.根据权利要求5所述的神经语义编解码分析方法,其特征在于,所述根据探针任务表现,通过消融任务以调整文本表示模型,具体包括:
将探针任务表现分别与神经编码器模型、神经解码器模型准确率关联,得到关联结果;
根据关联结果,损伤的文本表示模型,基于训练语料,通过损伤后文本表示模型生成句子向量表示,对神经解码器模型和神经编码器模型进行训练,确定所述神经解码器模型和神经编码器模型准确率;
根据所述准确率调整文本表示模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011102971.9/1.html,转载请声明来源钻瓜专利网。