[发明专利]一种基于融合词性和语义信息的Skip-gram模型的情感分析方法有效
申请号: | 201810481860.X | 申请日: | 2018-05-18 |
公开(公告)号: | CN108733653B | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 李瑞轩;文坤梅;黄伟;李玉华;辜希武;昝杰;龚晶 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/35 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智;曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于融合词性和语义信息的Skip‑gram模型的情感分析方法,包括:数据预处理、词性信息建模、词向量表示、语义信息建模、情感分析五个步骤。其中数据预处理包括过滤、分词、词性标注;词性信息建模包含基于上下文对词性信息建模;词向量表示模块在融合词性信息的Skip‑gram模型上进行向量训练;语义信息建模模块包括融合情感语义信息的文本表示。同现有技术相比,本发明考虑了单词的词性信息及情感语义信息,且在对单词的词性信息建模和融合语义信息的基础上,充分利用单词的词性信息帮助词向量训练以及情感语义先验信息帮助文本向量的学习,使得表示的文本向量更加符合语言学特征,对于情感分析有很好的结果。 | ||
搜索关键词: | 一种 基于 融合 词性 语义 信息 skip gram 模型 情感 分析 方法 | ||
【主权项】:
1.一种基于融合词性和语义信息的Skip‑gram模型的情感分析方法,其特征在于,该方法包括以下步骤:步骤1.评论语料库预处理,得到文本训练集;步骤2.基于文本训练集构建综合词性关联关系权重矩阵Zn×n,n为词性的数量;步骤3.基于综合词性关联关系权重矩阵Zn×n,融合词性信息建立Skip‑gram模型,基于该模型将文本训练集中每个单词转化为对应的词向量,得到词向量训练集;步骤4.基于词向量训练集,将评论语料库中的每个评论文档,在由词向量组成文档向量的过程中,加入语言学语义信息,得到文档向量数据集;步骤5.采用分类算法对文档向量数据集进行分类,实现情感分析。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810481860.X/,转载请声明来源钻瓜专利网。
- 上一篇:基于机器学习的影评情感倾向性分析的测试方法
- 下一篇:一种信息处理方法