[发明专利]词嵌入表示方法、装置及设备有效
申请号: | 202011032275.5 | 申请日: | 2020-09-27 |
公开(公告)号: | CN111881665B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 唐婧尧;薛云;冯锦辉;陈秉良;蔡倩华 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/284;G06F40/30 |
代理公司: | 广州骏思知识产权代理有限公司 44425 | 代理人: | 吴静芝 |
地址: | 510006 广东省广州市番禺区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 嵌入 表示 方法 装置 设备 | ||
1.一种词嵌入表示方法,其特征在于,包括步骤:
获取待表示词语、所述待表示词语所激活的大脑区域位置、所述待表示词语之间的从属关系以及所述待表示词语对应的第一词嵌入表示;
根据大脑区域位置与预设词语类别之间的对应关系,得到所述待表示词语的词语类别;基于所述待表示词语的词语类别,获取词语关系树中第一层的词语节点集合;其中,每个所述词语类别对应一个所述词语节点集合,所述词语节点集合包括属于所述词语类别的待表示词语对应的词语节点;根据所述待表示词语之间的从属关系,对每个所述词语节点集合内的词语节点继续分类,得到所述词语关系树;其中,所述词语关系树包括所述待表示词语对应的词语节点、所述词语节点对应的第一词嵌入表示和所述词语节点之间的初始连接关系;
根据所述词语节点之间的初始连接关系,获取每个所述词语节点的邻居节点;其中,所述邻居节点包括与所述词语节点直接连接的节点以及与所述词语节点间接连接的节点;
将所述词语节点与所述邻居节点连接,得到所述词语关系树对应的词语关系图;
基于所述词语关系图和预设的图注意力网络,获取所述词语关系图中每个所述待表示词语的第二词嵌入表示。
2.根据权利要求1所述的词嵌入表示方法,其特征在于,所述基于所述词语关系图和预设的图注意力网络,获取所述词语关系图中每个所述待表示词语的第二词嵌入表示,包括步骤:
基于共享注意力机制,获取每个所述邻居节点对所述词语节点的注意力系数;其中,所述注意力系数表示每个所述邻居节点对所述词语节点的重要性程度;
根据所述注意力系数和预设的归一化函数,得到所述注意力系数的注意力权重;
获取不同代的所述邻居节点对所述词语节点的距离权重;其中,同代的所述邻居节点处于所述词语关系树的同一层;
根据所述注意力权重、所述距离权重和预设的词嵌入表示传播策略,获取每个所述待表示词语的第二词嵌入表示。
3.根据权利要求2所述的词嵌入表示方法,其特征在于,所述基于共享注意力机制,获取每个所述邻居节点对所述词语节点的注意力系数,包括步骤:
根据所述词语节点的第一词嵌入表示和预设的共享注意力机制函数,得到每个所述邻居节点对所述词语节点的注意力系数;其中,所述预设的共享注意力机制函数如下:
eij=attention(Wxi,Wxj)=LeakyReLU(aT[Wxi;Wxj])
X={x1,x2,…,xN},xi∈RS
{x1,x2,…,xN}为词语节点的第一词嵌入表示,N为所述词语关系图中词语节点的个数,i和j分别表示词语节点i和词语节点j,xi为词语节点i的第一词嵌入表示,xj为词语节点j的第一词嵌入表示,R是矩阵的象征表示,S为第一词嵌入表示的维度,当S作为矩阵的上标时,其表示一个矩阵的列数,故xi∈RS表示xi是一个1行S列的矩阵,W为共享可学习参数矩阵,W∈RS′×S,表示W是一个S'行S列的矩阵,S'表示矩阵的行数,Wxi为共享可学习参数矩阵与词语节点i的第一词嵌入表示的乘积,Wxj为共享可学习参数矩阵与词语节点j的第一词嵌入表示的乘积,attention()函数是单层前馈神经网络,其激活函数是LeakyReLU(),a为权重向量,a∈R2S′,T代表向量的转置操作,α为预设系数,eij表示邻居节点对词语节点的注意力系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011032275.5/1.html,转载请声明来源钻瓜专利网。