[发明专利]一种基于Ising模型的无监督词嵌入表示学习方法有效

专利信息
申请号: 202110726042.3 申请日: 2021-06-29
公开(公告)号: CN113343710B 公开(公告)日: 2023-09-29
发明(设计)人: 王理;尹泽宇;潘文洁;邵劲松;姚敏;黄勋 申请(专利权)人: 南通大学;南通先进通信技术研究院有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F40/295;G06F18/22;G06N3/048;G06N3/088
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 沈海霞
地址: 226019 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 ising 模型 监督 嵌入 表示 学习方法
【权利要求书】:

1.一种基于Ising模型的无监督词嵌入表示学习方法,其特征在于,包含以下步骤:

步骤S1.将输入的文本数据实体依照Ising Model的数据结构构建稀疏矩阵WISM

步骤S2.将WISM经过SLEP的大规模稀疏数据处理得到全局关系矩阵WWCM

步骤S3.将输入的文本数据实体划分批次,构建批次文本数据实体集Batchi=(Vmi1,Vmi2,…,Vmij)T,i=1,…,n;

步骤S4.依次将n个批次文本数据实体集Batchi输入至Word2vec模型,利用Skip-Gram框架结合负采样的方法得到各实体Vmij的梯度及

其中,u∈{Vmij}∪NEG(Vmij),Con(Vmij)表示窗口中心实体Vmij的上下实体空间,NEG表示窗口中心实体Vmij的负采样实体空间;Veij为实体Vmij的词嵌入,表示u对应的辅助向量;

步骤S5.利用局部关系矩阵Wscm结合梯度更新辅助向量θu,利用负关系矩阵WNCM结合梯度更新Vmij的词嵌入Veij,所述局部关系矩阵Wscm通过实体Vmij及其对应的从全局关系矩阵WWCM中获得,所述负关系矩阵WNCM通过实体Vmij及其对应的负采样空间实体从全局关系矩阵WWCM中获得;

步骤S2中将采取LogisticR的方式来获取WISM的关系得分从而构建全局关系矩阵WWCM,具体公式如下:

WWCM=(X1X2,...,Xall)+(X1X2,...,Xall)T (2)

公式(1)中,wt是所有文本数据实体中第t个实体的权值,zt是WISM的第t列,zkt是WISM的第k行、第t列实体,Xk是zkt对应的相关度的解,λ是l1规范正则化参数,ρ是平方2范数的正则化参数;

步骤S4包含以下步骤:

步骤S41.依次将n个批次文本数据实体集Batchi输入至Word2vec模型,初始化得到批次文本数据实体集Batchi的词嵌入向量(Vei1,Vei2,…,Veij)T,对应关系如下所示:

(Vei1,Vei2,...,Veij)T=(Vmi1,Vmi2,...,Vmij)T·WVe (3)

公式(3)中,Veij为第j个实体Vmij对应的词嵌入,WVe则是向量生成过程中的权重矩阵;

步骤S42.将批次文本数据实体集Batchi经过配对生成Skip-Gram关系,同时采用负采样的方法得到窗口中心实体Vmij的上下实体空间Con(Vmij)以及窗口中心实体Vmij的负采样实体空间NEG(Vmij),从而得出中心实体Vmij的预测概率

公式(4)中,u∈{Vmij}∪NEG(Vmij),σ为sigmoid激活函数,表示u对应的辅助向量;

步骤S43.依据Batchi中Veij对上下实体空间Con(Vmij)以及负采样实体空间NEG(Vmij)中各实体配对之间的预测概率计算总损失函数Loss;

步骤S44.根据总损失函数Loss得到各实体Vmij的梯度及

步骤S5中更新后的辅助向量及词嵌入分别为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学;南通先进通信技术研究院有限公司,未经南通大学;南通先进通信技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110726042.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top