[发明专利]一种基于不定长上下文的词向量生成方法有效

专利信息
申请号: 201710609471.6 申请日: 2017-07-25
公开(公告)号: CN107608953B 公开(公告)日: 2020-08-14
发明(设计)人: 王俊丽;王小敏;杨亚星 申请(专利权)人: 同济大学
主分类号: G06F40/289 分类号: G06F40/289;G06F40/30;G06N3/08
代理公司: 上海科律专利代理事务所(特殊普通合伙) 31290 代理人: 叶凤
地址: 200092 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于不定长上下文的词向量生成方法。本发明涉及自然语言处理领域,特别涉及到基于不定长上下文的词向量生成方法。本发明的技术方案提出了一种不定长度的上下文划分策略和基于不定长上下文的词向量生成方法。这种策略利用标点符号把语料库划分成了长度不定,但语义完整的上下文。长度的不固定导致了传统的语言模型无法利用这种上下文生成词向量。为了应对这难题,本文结合卷积神经网络和循环神经网络设计了一个可以处理不定长上下文的语言模型F‑Model。经过实施结果分析,使用标点把语料库划分成语义完整的上下文可以提高词向量的质量。F‑Model具有良好的学习能力,实施得到的词向量蕴含丰富的语义和较好的线性关系。
搜索关键词: 一种 基于 不定 长上 下文 向量 生成 方法
【主权项】:
一种基于不定长上下文的词向量生成方法,其特征在于,首先在对语料库进行预处理后,使用标点符号划分上下文,把语料库划分为长度不等,语义完整的上下文单元。然后利用卷积神经网络学习上下文中各词的权重,这权重随后和语料库的全局分布结合生成上下文中各词的最终权重。随后利用这最终权重和词向量计算上下文的向量表达。随后利用上下文的向量表达构建和上下文中每个词之间的一对多映射关系。随后通过随机梯度算法训练模型,并最终获得词向量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710609471.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top