[发明专利]一种基于Ising模型的无监督词嵌入表示学习方法有效
申请号: | 202110726042.3 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113343710B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 王理;尹泽宇;潘文洁;邵劲松;姚敏;黄勋 | 申请(专利权)人: | 南通大学;南通先进通信技术研究院有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/295;G06F18/22;G06N3/048;G06N3/088 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 沈海霞 |
地址: | 226019 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ising 模型 监督 嵌入 表示 学习方法 | ||
1.一种基于Ising模型的无监督词嵌入表示学习方法,其特征在于,包含以下步骤:
步骤S1.将输入的文本数据实体依照Ising Model的数据结构构建稀疏矩阵WISM;
步骤S2.将WISM经过SLEP的大规模稀疏数据处理得到全局关系矩阵WWCM;
步骤S3.将输入的文本数据实体划分批次,构建批次文本数据实体集Batchi=(Vmi1,Vmi2,…,Vmij)T,i=1,…,n;
步骤S4.依次将n个批次文本数据实体集Batchi输入至Word2vec模型,利用Skip-Gram框架结合负采样的方法得到各实体Vmij的梯度及
其中,u∈{Vmij}∪NEG(Vmij),Con(Vmij)表示窗口中心实体Vmij的上下实体空间,NEG表示窗口中心实体Vmij的负采样实体空间;Veij为实体Vmij的词嵌入,表示u对应的辅助向量;
步骤S5.利用局部关系矩阵Wscm结合梯度更新辅助向量θu,利用负关系矩阵WNCM结合梯度更新Vmij的词嵌入Veij,所述局部关系矩阵Wscm通过实体Vmij及其对应的从全局关系矩阵WWCM中获得,所述负关系矩阵WNCM通过实体Vmij及其对应的负采样空间实体从全局关系矩阵WWCM中获得;
步骤S2中将采取LogisticR的方式来获取WISM的关系得分从而构建全局关系矩阵WWCM,具体公式如下:
WWCM=(X1X2,...,Xall)+(X1X2,...,Xall)T (2)
公式(1)中,wt是所有文本数据实体中第t个实体的权值,zt是WISM的第t列,zkt是WISM的第k行、第t列实体,Xk是zkt对应的相关度的解,λ是l1规范正则化参数,ρ是平方2范数的正则化参数;
步骤S4包含以下步骤:
步骤S41.依次将n个批次文本数据实体集Batchi输入至Word2vec模型,初始化得到批次文本数据实体集Batchi的词嵌入向量(Vei1,Vei2,…,Veij)T,对应关系如下所示:
(Vei1,Vei2,...,Veij)T=(Vmi1,Vmi2,...,Vmij)T·WVe (3)
公式(3)中,Veij为第j个实体Vmij对应的词嵌入,WVe则是向量生成过程中的权重矩阵;
步骤S42.将批次文本数据实体集Batchi经过配对生成Skip-Gram关系,同时采用负采样的方法得到窗口中心实体Vmij的上下实体空间Con(Vmij)以及窗口中心实体Vmij的负采样实体空间NEG(Vmij),从而得出中心实体Vmij的预测概率
公式(4)中,u∈{Vmij}∪NEG(Vmij),σ为sigmoid激活函数,表示u对应的辅助向量;
步骤S43.依据Batchi中Veij对上下实体空间Con(Vmij)以及负采样实体空间NEG(Vmij)中各实体配对之间的预测概率计算总损失函数Loss;
步骤S44.根据总损失函数Loss得到各实体Vmij的梯度及
步骤S5中更新后的辅助向量及词嵌入分别为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学;南通先进通信技术研究院有限公司,未经南通大学;南通先进通信技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110726042.3/1.html,转载请声明来源钻瓜专利网。