[发明专利]一种基于计算机信息处理技术的中文文本情感分析方法有效

专利信息
申请号: 201510452024.5 申请日: 2015-07-29
公开(公告)号: CN104965822B 公开(公告)日: 2017-08-25
发明(设计)人: 高琰;晁绪耀 申请(专利权)人: 中南大学
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 长沙正奇专利事务所有限责任公司43113 代理人: 马强,王娟
地址: 410083 湖南*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 计算机信息 处理 技术 中文 文本 情感 分析 方法
【说明书】:

技术领域

发明涉及自然语言处理技术,特别是一种基于计算机信息处理技术的中文文本情感分析方法。

背景技术

随着互联网和电子商务的飞速发展,人们越来越喜欢在网上购物并在网上发表自己对某产品的意见和看法。情感分析是人工智能方面的一个热门的研究领域,它的目标是使计算机从用户产生的主观性文本中提取出作者对评价对象的情感倾向性,即正向或负向。正向是指用户对这一产品的喜爱,他们对这个产品持有褒扬和肯定的态度;负向是指由于某一产品存在某种缺陷或者不满的地方,用户对该产品持有消极的态度。

目前,对于网络商品评论情感分析的主要方法有基于情感知识的方法和基于机器学习的方法上。

基于情感知识的方法主要依靠一些已有的情感词典和语言知识,来对文本的情感倾向进行分类。如:Polanyi等人专注于对极性单词和相关的非元件内容词构建几个情感词典和情感规则;Velikovich等人展示了如何用一个种子词典和生成图框架学习一个大的情感词典进而对文本进行情感分析等。Lee等人通过比较正向词汇与负向词汇的个数判别文本的情感倾向性,即个数较多的哪一方作为整个文本的情感倾向。情感词典主要依赖于专家的制定,不能反映其的全面性。

基于机器学习的方法包括有监督和无监督学习。Turney等人提出了一种运用无监督学习对文档级文本进行情感分析的方法;唐慧丰等人运用n-gram模型,提取名词、动词、副词、形容词等作为文本的特征,又分别运用KNN、贝叶斯和SVM分类器对文本进行分类,同时在不同的规模以及不同的特征数量上进行训练,从而识别出文本的情感倾向性分析;孙艳等人提出了一种无监督的主题情感混合模型,此模型在不对文本进行标注的基础上,采集每个句子的情感标签和主题标签,从而得到此文本的情感词,进而实现对文档级的情感进行分类。但中文文本的产品评论,面向多语义、多规则的中文,用机器学习对它们进行情感自动分析时由于选择或提取的特征不恰当,往往导致准确性不高。

在基于机器学习的情感分析中,特征提取是决定分析效果的重要因素。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。RBM做为深度学习的一种算法,具有深度学习逐层学习,获得数据结构信息的特性,因此可以用于抽取表示情感极性的特征。

发明内容

本发明所要解决的技术问题是,针对现有技术不足,提供一种基于计算机信息处理技术的中文文本情感分析方法。

为解决上述技术问题,本发明所采用的技术方案是:一种基于计算机信息处理技术的中文文本情感分析方法,包括以下步骤:

1)输入中文产品评论文本集,用结巴分词中的精确模式进行中文分词,并确定词性,根据词性进行过滤,保留词性为名词、形容词、副词和连词的词汇,通过中文分词获得已分词后的语料集,对通过中文分词切分成词语的文本进行计算,得到每个词语在每条评论的权值,产生评论向量;

2)采用受限玻尔兹曼机对上述评论向量进行特征选择;所述受限玻尔兹曼机由可见层V和隐藏层H构成,层中节点神经元是二元随机数,可见层的节点相互独立,隐藏层节点间相互独立;可见层节点与隐藏层节点之间的连接权值为W;上述步骤1)产生的评论向量输入可见单元层;

3)受限玻尔兹曼机通过对比散度方法进行训练,初始化受限玻尔兹曼机的相关参数,迭代100次后,得到隐藏层节点hi=1在可视层v下的条件概率p(hi=1/v)和可视层节点vi=1在隐藏层h下的条件概率p(vi=1/h);其中,函数偏置量ai和bj初始值均为0;wij为可见层的节点i与隐藏层的节点j间的连接权重值,wij服从均值为0,标准差为1的正态分布;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510452024.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top