[发明专利]一种基于GRU模型的老挝语情感分析方法在审

专利信息
申请号: 201910215265.6 申请日: 2019-03-21
公开(公告)号: CN110083825A 公开(公告)日: 2019-08-02
发明(设计)人: 周兰江;陈琢;张建安;周枫 申请(专利权)人: 昆明理工大学
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 暂无信息 代理人: 暂无信息
地址: 650093 云*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 情感分析 老挝语 向量空间 变体 同义词 词表 自然语言处理 词性分析 数值向量 算法模型 文本内容 文本语义 细胞状态 向量运算 隐藏状态 词向量 输入门 相似度 聚类 合成 输出 学习 更新 研究
【说明书】:

发明涉及一种基于GRU模型的老挝语情感分析方法,它属于自然语言处理和深度学习技术领域。GRU作为LSTM的一种变体,将忘记门和输入门合成了一个单一的更新门。同时还混合了细胞状态和隐藏状态。最终的模型比标准的LSTM模型要简单,也是非常流行的变体。Word2Vec就是将词表征为实数值向量的一种高效的算法模型,其利用深度学习的思想,可以通过训练,把对文本内容的处理简化为K维向量空间中的向量运算,而向量空间上的相似度可以用来表示文本语义上的相似。Word2Vec输出的词向量可以被用来做很多NLP相关的工作,比如聚类、找同义词、词性分析等等。利用基于GRU的老挝语情感分析模型,可以有效的对老挝语进行情感分析,因此本发明具有一定的研究意义。

技术领域

本发明涉及一种基于GRU(门控循环单元)模型的老挝语情感分析方法,属于自然语言处理中小语种识别领域。

背景技术

情感分析是帮助用户快速获取、整理和分析相关信息,对带有情感色彩的主观性文本进行分析、处理、归纳和推理。在一般情况下将其分为正类、负类,其中对于赞美和肯定的情感分为正类;对于批评和否定的情感分为负类。

情感分类是指根据文本所表达的含义和情感信息将文本划分成褒扬的或贬义的两种或几种类型,是对文本作者倾向性和观点、态度的划分。

情感分类作为一种特殊的分类问题,既有一般模式分类的共性问题,也有其特殊性,如情感信息表达的隐蔽性、多义性和极性不明显等。针对这些问题人们做了大量研究,提出了很多分类方法。这些方法可以按机器学习方法归类,也可以按情感文本的特点划分。

根据机器学习方法所使用训练样本的标注情况,情感文本分类可以大致分为三类:有监督学习方法:基于有监督学习的情感分类方法使用机器学习方法用于训练大量标注样本;半监督学习方法:基于半监督学习的情感分类方法是通过在少量标注样本上训练,并在大量未标注样本上进行学习的方式构建分类模型;无监督学习方法:基于无监督学习的情感分类方法是指仅使用非标注样本进行情感分类建模。

Word2Vec是Google于2013年开源推出的一个获取Word to Vector的工具包。在Word2Vec出现以前,比较通用的解决步骤是WordNet,它是一个类似词典一样的存在,不能做到实时更新,虽然能够找到一个词的同义词,但是词之间的相似度到底有多高这个指标很难度量。而传统One-Hot表示法是借用一个固定长度的词汇表,每个词代表其中的一维。这种表示方法太过稀疏,而且无法度量词语之间的相似性。

GRU神经网络单元是2014年由Cho等人基于LSTM(长短期记忆网络)变形而来,旨在解决标准RNN中出现的梯度消失问题。GRU保持了LSTM的效果同时又使结构更加简单,所以它也非常流行。

传统方法都限于挖掘句中词之间的词汇特征以及句法特征,而在语言中往往蕴含词语之间的隐含信息及语义特征,会对感情信息的识别起到很大作用。对于感情表示准确的语句来说大多方法可以精准识别,但在老挝语情感分析领域仍然存在问题,相较与中文和英文的情感分析,老挝语情感分析有以下几个问题:(1)人工标注语料不充足,语料爬取困难,数据预处理难度较大;(2)国内对老挝语方向研究的内容较少之又少等。

发明内容

本发明要解决的技术问题是提出了一种基于GRU模型的老挝语情感分析方法,利用Word2Vec先进行语料词向量的训练,通过计算词语间的余弦距离进行聚类并扩充到词典。利用扩充词典作为老挝语语句词向量生成器将老挝语语句转化为语句向量,然后使用Word2Vec进行训练生成相应的特征向量,用于解决老挝语情感分析的准确率不高等问题。

本发明采用的技术方案是:一种基于GRU模型的老挝语情感分析方法,具体步骤如下:

Step1,老挝语情感分析语料预处理,并进行数据集划分;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910215265.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top