[发明专利]一种基于深度学习的感性词向量及情感分类方法在审
申请号: | 201711183892.3 | 申请日: | 2017-11-23 |
公开(公告)号: | CN108038492A | 公开(公告)日: | 2018-05-15 |
发明(设计)人: | 姚全珠;祝元勃;费蓉;张生杰 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/27;G06N3/08 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 蒋姝泓 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 感性 向量 情感 分类 方法 | ||
本发明公开的一种基于深度学习的感性词向量及情感分类方法,首先构建词的上下文模型,其次,向词的上下文模型中加入情感信息,构建出感性词向量,最后,通过主动深度置信网络方法并结合感性词向量进行评论文档的半监督情感的分类,解决了现有的词向量学习算法通常只使用单词的上下文,而忽略了文本的情感信息的问题。
技术领域
本发明属于自然语言处理技术领域,涉及一种基于深度学习的感性词向量及情感分类方法。
背景技术
随着信息技术的高速发展,网络、信息化技术以一种前所未有的速度迅速影响着人们的生活。与此同时,推特(Twitter)、脸书(Facebook)、微博等社交平台和亚马逊(Amazon)、京东、天猫等电子商务平台的兴起,网络上的评论性文本资源与日俱增。面对来自这些平台的大量非结构化的评论词语和文本,迫切需要通过自然语言处理技术对用户评论词语所表达的情感倾向进行分析判断,作为用户,可以利用这些感性分析的结果扩大自己的选择对象,也可以对某些产品或者相关事件有一个全面的认识,做出更加有利于自己的抉择;作为企业,通过感性分析过程可获取用户的心理需求,做出具有针对性的措施,制定更为合理的业务服务体系,提高自己的产品消费利益;作为政府,可以从群众对社会热点问题的评论情感分析中,及时了解民众心理,发现社会舆情以及舆情走势,更好的处理各种社会问题,改进政府的方针政策和引导群众舆论走向。
中文信息处理一般是以词语为单位,评论文本是由若干个中文句子组成的,而中文句子则由一个一个汉语词语组建而成的。所以,对现有词的分析技术日趋重要。以往的技术从自然语言处理(NLP)和机器学习两个方面展开对评论文本的自动分析,然而NLP主要利用语言学知识进行分析,缺乏有效的手段利用庞大的用户数据改善分析效果;而机器学习虽然可以通过用户数据支撑训练过程使得模型更加精细化,但通用算法缺乏对评论文本语义的理解,导致学习结果不能令人满意。因此,近年来的研究集中在将这两类方法相结合的工作上,以下内容将主要介绍现有词语的分析技术。
(1)基于矩阵的分布:通常称为分布语义模型,这种方法需要构建一个“词-上下文”矩阵,从矩阵中获取词的表示。在“词-上下文”矩阵中,每行对应一个词,每列表示一种不同的上下文,矩阵中的每个元素对应相关词和上下文的共现次数。在这种表示下,矩阵中的一行,就成为了对应词的表示,这种表示描述了该词的上下文的分布。由于分布假说认为上下文相似的词,其语义也相似,因此在这种表示下,两个词的语义相似度可以直接转化为两个向量的空间距离。
(2)基于聚类的分布表示:通过聚类手段构建词与其上下文之间的关系。聚类结果为每个词的多层类别体系。因此可以根据两个词的公共类别判断这两个词的语义相似度。它是一种硬聚类,每一个词都在且只在唯一的一个类中。
(3)基于神经网络的分布表示:一般称为词向量、词嵌入或分布式表示。通过神经网络技术对上下文,以及上下文与目标词之间的关系进行建模。构建上下文与目标词之间的关系,最自然的一种思路就是使用语言模型。同时,神经网络语言模型对后期词向量的发展方向有着决定性的作用。
目前现有词语的分析技术中,因为具有相似上下文但相反情感极性的词被映射到相邻的单词向量,现有的词向量学习算法通常只使用单词的上下文,而忽略了文本的情感信息,因此无法准确的建立情感词向量及文本的情感分类。
发明内容
本发明的目的是提供一种基于深度学习的感性词向量及情感分类方法,解决了现有的词向量学习算法通常只使用单词的上下文,而忽略了文本的情感信息的问题。
本发明所采用的技术方案是,
一种基于深度学习的感性词向量及情感分类方法,首先进行词的上下文模型的最小化处理,其次,向处理后的词的上下文模型中加入情感信息,构建出感性词向量,最后,通过主动深度置信网络方法并结合感性词向量进行评论文档的半监督情感分类。
本发明的特点还在于,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711183892.3/2.html,转载请声明来源钻瓜专利网。