[发明专利]一种基于转折句语义块划分机制的情感分类方法有效
申请号: | 201810171490.X | 申请日: | 2018-03-01 |
公开(公告)号: | CN108388654B | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 张玉红;王勤勤;李玉玲;李培培;胡学钢 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/205;G06F40/289 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 转折 语义 划分 机制 情感 分类 方法 | ||
本发明公开了一种基于转折句语义块划分机制的情感分类方法,其步骤包括:1.利用已知的词向量字典,把训练集和测试集中的每条样本表示为词向量矩阵;2.选取合适的卷积核对词向量矩阵进行卷积,提取映射特征向量以实现降维;3.构建转折词字典,并通过查询转折词在样本中的位置,对提取的映射特征进行语义划分,提取每个划分块中的最重要信息,形成最终特征空间;4.基于所述最终特征空间训练分类器,并对测试集中的样本进行分类。本发明基于构建的转折词字典,实现了句子语义块的划分,能获得每段中的重要语义信息,同时考虑了句子的位置结构特征,从而能够提高文本情感分类的正确性。
技术领域
本发明属于自然与语言处理领域的情感分类问题,尤其针对包含多种语义的情感表达方式,如欲抑先扬或欲扬先抑的转折句,进行有效的情感分类。
背景技术
随着Internet的飞速发展,以网络为传播媒介的文本信息越来越受到企事业单位和个人的关注,网络信息可为政府部门了解民众意向,企业通过开辟产品评论了解用户对产品的意见以改进产品性能,消费者通过产品评论来指导消费行为。然而,网上每天都有大量的新评论出现,评论开始可能是积极肯定的态度但考虑到其他因素可能会转变为否定态度,即存在先抑后扬、先扬后抑或反复改变态度的现象。例如:社交网络(包括:国内的腾讯/新浪微博、人人网,国外的Facebook、Twitter等)每天都会产生大量的用户数据,而其中包含大量的人们就某事件发表个人观点的文本信息。例如:腾讯新闻上关于“小黄车死亡案”的一条评论:“出于人道主义精神的赔付是可以理解的,但是一味追着共享单车提供方是非常没有逻辑的。况且作为受害人,你本身也是有过错的,如果你不去违规使用共享单车,就不会出现现在的局面。”首先是对共享单车提供方应该给予赔偿持肯定态度,但后面又转折表达受害人自己也需要承担责任。例如:购物平台(包括:京东商城、苏宁易购、天猫等)每天都会产生海量的用户网购评论信息;例如:京东一条购买手机用户的评论:“声音太小,接电话挺费劲的,声音开到最大效果也不明显,不过上网速度很快,外形非常漂亮,整体好评”,先是表达缺点后面肯定陈述整理比较满意。现实生活中的这些评论信息除具有能表达情感极性的情感词外,又含有转折词使评论信息同时具有正/负两种情感,这一特点使得文本情感分类问题变得更加复杂,也使得传统的数据挖掘算法和已有的机器学习方法面临严峻的挑战:
挑战之一:传统的基于情感字典的无监督分类方法,通过情感字典分析句子中词语的情感极性,并通过对这些词语极性的简单求和来决定句子整体的情感倾向,对词语的重要度不做区分,显然难以得到较好的效果;
挑战之二:基于机器学习的文本情感倾向分析方法(包括:k-近邻、支持向量机SVM、Bayes等)存在以下几个主要问题:1)采用传统的词袋法进行表示,文本向量的维数较高且数据较为稀疏,不利用模型的训练;2)仅考虑特征间的句法结构而忽略其语义信息,造成特征映射结果上的语义不匹配,无法很好地表示文档的语义。
挑战之三:现有的深度学习方法能学习句子特征,典型的神经网络结构如循环神经网络(RNN)和卷积神经网络(CNN),这两种模型都是用词向量表示特征空间,并利用语义合成的方法提取句子的特征,最后使用分类器对其情感极性分类。相对于RNN模型,CNN参数数量较少,且能更好地捕捉文本的语义特征,时间复杂度也远小于RNN。然而,传统的CNN网络用于情感分析时忽略了句子的结构特征,Max-pooling方法从句子的特征按照重要度中提取一个最大值,并不对句子的结构作任何区分。这一特点使得该方法在转折句的处理上效果不佳。
发明内容
为了解决所述三个挑战中所存在的问题,本发明提供一种基于转折句语义块划分机制的情感分类方法,以期基于构建的转折词字典,对特征映射空间进行分段实现句子语义块的划分,从而获得每段中的重要语义信息,同时考虑句子的位置结构特征,进而提高文本情感倾向分析的正确性。
本发明为达到所述发明目的,采用如下技术方案:
本发明一种基于转折句语义块划分机制的情感分类方法的特点是按如下步骤进行:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810171490.X/2.html,转载请声明来源钻瓜专利网。