[发明专利]用于神经主题建模中的多视图和多源迁移的方法和系统在审
申请号: | 202080048428.7 | 申请日: | 2020-06-24 |
公开(公告)号: | CN114072816A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | P·古普塔;Y·乔德哈里 | 申请(专利权)人: | 西门子股份公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06N7/00;G06N3/04;G06N3/08 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 徐红燕;吕传奇 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 神经 主题 建模 中的 视图 迁移 方法 系统 | ||
本发明涉及神经主题建模(NTM)的计算机实现方法、相应的计算机程序、计算机可读介质和数据处理系统。在NTM的方法中利用具有或不具有多源迁移(MST)的全局视图迁移(GVT)或多视图迁移(MTV),多视图迁移(MTV)即联合应用的GVT和局部视图迁移(LVT)。针对GVT,准备隐主题特征的预训练的主题知识库(KB),并且通过GVT经由在主题KB的相关隐主题特征的指导下学习有意义的隐主题特征来将知识迁移到目标。这是通过扩展损失函数并且最小化经扩展的损失函数来实现的。此外,针对MVT,附加地准备单词嵌入的预训练的单词嵌入KB,并且通过LVT经由在单词嵌入KB的相关单词嵌入的指导下学习有意义的单词嵌入来将知识迁移到目标。这是通过扩展用于计算预激活的项来实现的。
本发明涉及一种神经主题建模(NTM)的计算机实现方法、以及相应计算机程序、相应计算机可读介质和相应数据处理系统。特别地,在NTM的方法中利用具有或不具有多源迁移(MST)的全局视图迁移(GVT)或多视图迁移(MTV),在多视图迁移(MTV)中,联合地应用GVT和局部视图迁移(LVT)。
概率主题模型,诸如LDA(Blei et al.,2003,Latent dirichlet allocation.Journal of Machine Learning Research,3:993-1022)、复制的Softmax(RSM)(Salakhutdinov and Hinton,2009,Replicated softmax:an undirected topic model.In Advances in Neural Information Processing Systems 22:23rd AnnualConference on Neural Information Processing Systems,pages 1607-1614. CurranAssociates,Inc.)和文档神经自回归分布估计器(DocNADE)(Larochelle and Lauly,2012,A neural autoregressive topic model. In Advances in Neural InformationProcessing Systems 25:26th Annual Conference on Neural Information ProcessingSystems,pages 2717-2725)经常用于从文本集合中提取主题,并且学习隐文档表示来执行自然语言处理任务,诸如信息检索(IR)。尽管它们已经在对大型文本语料库进行建模方面被示出是强大的,但是主题建模(TM)仍然是具有挑战性的,尤其是在数据稀疏的设置中(例如,在短文本或少量文档的语料库上)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子股份公司,未经西门子股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080048428.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:冷冻机用工作流体组合物和冷冻机油
- 下一篇:液体透镜