[发明专利]词向量更新方法和装置有效

专利信息
申请号: 201810144166.9 申请日: 2018-02-12
公开(公告)号: CN110162766B 公开(公告)日: 2023-03-24
发明(设计)人: 宋彦 申请(专利权)人: 深圳市腾讯计算机系统有限公司
主分类号: G06F40/289 分类号: G06F40/289;G06F40/247;G06F16/35
代理公司: 深圳市联鼎知识产权代理有限公司 44232 代理人: 刘抗美
地址: 518000 广东省深圳市南*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 向量 更新 方法 装置
【说明书】:

发明揭示了一种词向量更新方法,包括:获取训练原词向量时所生成的第一模型和第二模型,所述第一模型用于根据输入词预测上下文,所述第二模型用于根据上下文预测目标词;将来自目标语料的语料单元输入所述第一模型,并将所述第一模型的输出输入所述第二模型,获取使所述第二模型输出所述语料单元时由所述第一模型和所述第二模型产生的损耗;以及根据所述损耗来更新所述第一模型和所述第二模型。基于上述实施例提供的词向量更新方法,能够仅在目标语料的基础上同时实现对第一模型和第二模型的更新训练。

技术领域

本发明涉及计算机应用技术领域,特别涉及一种词向量更新方法、装置、计算机可读存储介质和电子设备。

背景技术

随着计算机应用技术的不断发展,自然语言处理得到了越来越广泛的应用。机器翻译、语音识别及信息检索等应用需求对计算机的自然语言处理能力提出了越来越高的要求。

目前,在处理自然语言任务时,分布式表达(distributed representation)是一种普遍使用的文本表示方法。这种方法通过训练将自然语言中的每一个词映射成一个固定长度的向量,将所有这些向量放在一起形成一个词向量空间,每一向量则为该空间中的一个点,进而直接用词向量取代词本身来表示文本,从而将自然语言的理解转化为机器学习的数学化问题。

为了基于自然语言训练得到能够用于后续机器处理的词向量,相关技术提出了多种侧重于不同处理场景的训练模型,例如更适用于文本分类处理的上下文到词(Continuous Bag-of-words,CB)模型以及更适用于序列标注处理的词到上下文(Skip-Gram,SG)模型等等。然而,这些模型均不支持增量式的训练,一旦需要对训练得到的词向量进行调整,往往需要重新构建大规模语料并从零开始训练词向量,从而带来额外的计算负担。

除了词向量的训练,词向量的更新(retrofitting)也是有效提升词向量性能的关键技术。常见的词向量更新流程一般是针对预先训练好的给定词向量,通过人工标注或自动抽取的词与词的关系作为指导,对词向量进行调整,进而将原本低质量的词向量提升为高质量的词向量。然而,这样的更新方法仅适用于少量词语,对于标注数据之外的词语往往无能为力。

由此可见,目前的词向量训练模型及更新方法都不能直接使用任意外部信息来提高词向量的质量,也无法解决将旧的词向量调整用于新的使用环境的领域迁移问题。

发明内容

为了解决相关技术中无法通过增量训练来实现词向量质量提高和跨领域使用等技术问题,本发明提供了一种词向量更新方法、装置、计算机可读存储介质和电子设备。

根据本发明的实施例,提供一种词向量更新方法,包括:获取训练原词向量时所生成的第一模型和第二模型,所述第一模型用于根据输入词预测上下文,所述第二模型用于根据上下文预测目标词;将来自目标语料的语料单元输入所述第一模型,并将所述第一模型的输出输入所述第二模型,获取使所述第二模型输出所述语料单元时由所述第一模型和所述第二模型产生的损耗;以及根据所述损耗来更新所述第一模型和所述第二模型。

根据本发明的实施例,提供一种词向量更新方法,包括:获取训练方向相反的第一模型和第二模型;将待训练的目标语料输入所述第一模型,并将所述第一模型的输出输入所述第二模型,获取使所述第二模型输出目标语料时分别由所述第一模型和所述第二模型产生的损耗;以及根据所述损耗来更新所述第一模型和所述第二模型。

根据本发明的实施例,提供一种词向量更新装置,包括:初始化模块,设置为获取训练原词向量时所生成的第一模型和第二模型,所述第一模型用于根据输入词预测上下文,所述第二模型用于根据上下文预测目标词;损耗获取模块,设置为将来自目标语料的语料单元输入所述第一模型,并将所述第一模型的输出输入所述第二模型,获取使所述第二模型输出所述语料单元时由所述第一模型和所述第二模型产生的损耗;以及模型更新模块,设置为根据所述损耗来更新所述第一模型和所述第二模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯计算机系统有限公司,未经深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810144166.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top