[发明专利]一种文本情绪分类方法及系统有效
申请号: | 201710691593.4 | 申请日: | 2017-08-14 |
公开(公告)号: | CN110019772B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 王宁君;张春荣;赵琦 | 申请(专利权)人: | 普天信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李官 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 情绪 分类 方法 系统 | ||
本发明提供一种文本情绪分类方法,包括:S1、基于限制递归神经张量网络模型中预设的权重矩阵集,在文本中提取权重大于预设阈值的词项作为语义实词;S2、基于训练后的限制递归神经张量网络模型,提取所述语义实词的情绪特征;S3、基于所述语义实词的情绪特征,对所述文本进行情绪分类。本发明提供的文本情绪分类方法及系统,通过在递归神经张量网络模型的基础上,添加权重矩阵集使得模型训练对于虚词权重降低,使得文本情绪特征检测能更专注于实词,减少信息冗余干扰,提高文本情绪分类准确率。
技术领域
本发明涉及文本信息处理领域,更具体地,涉及一种文本情绪分类方法及系统。
背景技术
据《中国互联网络发展状况统计报告》调查结果显示,截至2016年12月,中国网民规模达7.31亿,相当于欧洲人口总量,互联网普及率达到53.2%。互联网在整体环境、应用普及和热点行业发展等领域都取得了令人瞩目的成绩。随着网络技术的发展和普及,网络不仅给网民提供了信息传播的新途径,并且为用户提供了快捷、方便的交互方式,作为读者与作者,读者与读者之间架起了沟通的桥梁。互联网在信息传播领域越来越突出的作用不仅引起了学术界对网络舆情的关注,许多对信息敏感的行业如证券、金融以及政府机构也逐渐将目光投向这一研究领域。在网上,越来越多的用户利用互联网来发表自己的观点,由此产生了大量数文本数据。这些数据不仅包含权威的官方信息,也包含可信度较差的非官方信息,甚至是虚假信息。并且由于网络的开放性和共享性,用户参与进来发表自己的观点,免不了会产生“情绪化”的内容。其中的一些信息广泛传播必然会在社会上造成舆论效应,或积极或消极。因此,把握互联网用户的“情绪化”信息逐渐成为大众舆情监测的重要组成部分。而目前对情绪倾向性分析缺乏有效的分析工具,很难捕捉相关文章的主流情绪。
目前,现有的文本情绪分类方法一般采用传统的词袋模型和人工标注法和回溯神经网络(RNN)模型分类法。传统的词袋模型和人工标注法首先人工构建情绪匹配知识库,将待分类文本与情绪匹配知识库进行匹配,得到待分类文本的情绪特征,将所述待分类文本的情绪特征进行分类,得到文本的情绪分类结果。RNN模型可用来预测句子级的情绪分布的深度学习算法,不需要词典和极性转换。算法使用空间向量表示句子结构,解决了词袋模型无法表示符合语义的缺陷,同时使用情绪分布来替代传统的一维情绪评价方式。进一步的,在RNN模型的基础上,有人提出了递归神经张量网络(RNTN)模型,该模型加强了词的表示形式,除了词向量外,还往其中加入一个词矩阵,通过这么做新的模型将不仅仅拥有表达嵌入词含义的能力,它还拥有学习一个单词是如何修饰其他单词的能力,即给词语赋予了两种表达方式,使得词语能够尽可能的符合语义环境。
但是,现有技术使用的RNTN模型虽然通过构建词向量和词矩阵来对词语进行两重标定,但是在这个过程中会出现大量的信息冗余,例如一些冠词如:the、a等也会被以相同的重要程度纳入到语义信息中,但在进行文本分类时,文本中所包含的语义实词情绪特征才是分类过程中所需要的判别特征,那么在使用该模型进行文本情绪分类时,分类精确度将会受到冗余干扰,导致分类精度不高。
发明内容
本发明提供一种克服上述问题或者至少部分地解决上述问题的一种文本情绪分类方法及系统。
根据本发明的一个方面,提供一种文本情绪分类方法,其特征在于,包括:
S1、基于限制递归神经张量网络模型中预设的权重矩阵集,在文本中提取权重大于预设阈值的词项作为语义实词;
S2、基于训练后的限制递归神经张量网络模型,提取所述语义实词的情绪特征;
S3、基于所述语义实词的情绪特征,对所述文本进行情绪分类。
其中,步骤S1之前所述方法还包括:
在递归神经张量网络模型中添加权重矩阵集,并基于预设的限制函数,缩小所述递归神经张量网络模型中的循环检测器大小,从而构建所述限制递归神经张量网络模型。
其中,所述限制递归神经张量网络模型为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普天信息技术有限公司,未经普天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710691593.4/2.html,转载请声明来源钻瓜专利网。