[发明专利]词嵌入模型的增量生成在审
申请号: | 201910107979.5 | 申请日: | 2019-02-02 |
公开(公告)号: | CN110134972A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 佩罗·苏巴西奇;林晓 | 申请(专利权)人: | 株式会社NTT都科摩 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27;G06F16/33;G06N3/04 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 林强 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本语料库 向量模型 嵌入 向量变换 向量 自由 访问 | ||
1.一种计算机化方法,包括:
接收第一向量模型,其中,所述第一向量模型由在第一语料库上训练的第一神经网络产生,并且其中,所述第一神经网络包括多个隐藏节点,并且其中,所述第一向量模型跨越由多个第一基向量定义的向量空间;
在第二语料库上训练第二神经网络以产生第二向量模型,其中,所述第二神经网络具有与所述第一神经网络中包括的相同数量的多个隐藏节点,并且其中,所述第二向量模型跨越由多个第二基向量定义的向量空间;
确定将所述多个第二基向量变换为所述多个第一基向量的变换矩阵;
使用所述变换矩阵将所述第一向量模型和所述第二向量模型变换为组合的向量模型。
2.根据权利要求1所述的方法,其中,所述第一向量模型中的第一多个向量由嵌入也被所述第二向量模型嵌入的多个词产生,并且其中,所述第二向量模型中的第二多个向量对应于所述第一多个向量,并且其中,对于所述第一多个向量中的每个向量,变换所述第一向量模型和所述第二向量模型包括:
将该向量乘以系数以形成加权向量;
将所述第二多个向量中的相应向量乘以所述变换矩阵以形成变换后的向量;以及
将所述加权向量和所述变换后的向量相加以形成第一变换后的向量。
3.根据权利要求2所述的方法,其中,所述第二向量模型还包括第三多个向量,所述第三多个向量由未被所述第一向量模型嵌入的词产生,并且其中,变换所述第一向量模型和所述第二向量模型还包括:
将所述第三多个向量中的每个向量乘以所述变换矩阵以形成第二变换后的向量。
4.根据权利要求1所述的方法,其中,所述第一向量模型是Word2Vec向量模型。
5.根据权利要求1所述的方法,其中,所述第一向量模型是公共域向量模型。
6.根据权利要求1所述的方法,其中,所述多个第一基向量中的每个第一基向量与所述多个第二基向量中的每个第二基向量正交。
7.根据权利要求1所述的方法,其中,确定所述变换矩阵包括使用最小二乘法求解一组等式。
8.根据权利要求2所述的方法,其中,对于所述第一多个向量中的每个向量:将该向量乘以系数以形成加权向量包括将该向量乘以因子(r/(r+1)),其中,r是所述第一语料库的第一语料库大小与所述第二语料库的第二语料库大小的比率。
9.根据权利要求8所述的方法,其中,r等于500。
10.根据权利要求8所述的方法,其中,对于所述第一多个向量中的每个向量:将所述第二多个向量中的相应向量乘以所述变换矩阵以形成变换后的向量包括将所述第二多个向量中的相应向量乘以所述变换矩阵和因子(1/(r+1))以形成变换后的向量。
11.一种计算机化系统,包括:
存储器,其被配置为存储第一向量模型,其中,所述第一向量模型由在第一语料库上训练的第一神经网络产生,并且其中,所述第一神经网络包括多个隐藏节点,并且其中,所述第一向量模型跨越由多个第一基向量定义的向量空间;
向量训练模块,其被配置为在第二语料库上训练第二神经网络以产生新的向量模型,其中,所述第二神经网络具有与所述第一神经网络中包括的相同数量的多个隐藏节点,并且其中,所述第二向量模型跨越由多个第二基向量定义的向量空间;以及
变换模块,其被配置为确定用于将所述多个第二基向量变换为所述多个第一基向量的变换矩阵,并且被配置为使用所述变换矩阵将所述第一向量模型和所述第二向量模型变换为组合的向量模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社NTT都科摩,未经株式会社NTT都科摩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910107979.5/1.html,转载请声明来源钻瓜专利网。