[发明专利]一种情感分析方法在审
申请号: | 202110997775.0 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113705243A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 罗瑜;吴晓华;令狐阳 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/242;G06N3/04;G06N3/08 |
代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 李蕊 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 情感 分析 方法 | ||
本发明公开了一种情感分析方法,通过获取训练文本集,并对所述训练文本集进行预处理得到训练情感得分向量集,基于所述训练情感得分向量集和预设语义词向量集对预设的神经网络进行训练,基于训练后的神经网络对待分析文本进行情感分析,对所述训练文本集进行预处理得到训练情感得分向量具体包括,对所述训练文本集进行分词处理,基于预设文本长度对分词处理后的训练文本集进行长度裁剪或补正得到标准训练文本集,基于情感词典确定出所述标准训练文本集对应的训练情感得分向量集,实现了分析文本的具体含义,能够将情感词典与神经网络结合,能够有效分析无规则文本,在进行情感分析时准确度较高,且运行效率高。
技术领域
本发明属于人工智能技术领域,具体涉及一种情感分析方法。
背景技术
随着社交媒体的兴起,人们在微博、评论等信息交互的过程中,产生了大量表达人们各种感情和倾向的信息,通过对情感信息的分析,可以更好的分析用户的喜好,预测事物发展趋势。目前,情感分析已经成长为自然语言处理领域最活跃的研究领域之一,被广泛应用于市场营销、分析舆论等领域。
目前情感分析的方法可以分为两类:基于情感词典的方法和基于机器学习的方法。情感词典的方法基于词典和规则,通过找寻文本中的各类情感词,计算每句的情感倾向分值来达到情感分析的效果,其语料适用范围广,但受限于情感词典的质量和覆盖度。机器学习的方法又包含了基于特征的方法和基于深度学习的方法。基于特征的方法从大量语料中选取特征对文本进行表示,然后使用支持向量机(SVM)、决策树等机器学习方法进行情感分析,受限于特征的选取。深度学习的方法通过训练集进行分类训练实现对文本的情感分析,避免了人工特征提取工作,能够有效地处理文本前后关联的问题,有着强大的判别能力和特征自学能力,适合高维数、无标签和大数据的特点,也是现在使用最广泛的方法。
但现有技术降低了对特征工程和语言学知识的依赖,但忽视了文本的具体意义,导致情感分析准确度不高。
因此,如何提高情感分析的准确度,是本领域技术人员有待解决的技术问题。
发明内容
本发明的目的是为了解决现有技术对于情感分析准确度不高的技术问题,提出了一种情感分析方法。
本发明的技术方案为:一种情感分析方法,包括以下步骤:
S1、获取训练文本集,并对所述训练文本集进行预处理得到训练情感得分向量集;
S2、基于所述训练情感得分向量集和预设语义词向量集对预设的神经网络进行训练;
S3、基于训练后的神经网络对待分析文本进行情感分析。
进一步地,所述步骤S1中对所述训练文本集进行预处理得到训练情感得分向量具体包括以下分步骤:
S11、对所述训练文本集进行分词处理;
S12、基于预设文本长度对分词处理后的训练文本集进行长度裁剪或补正得到标准训练文本集;
S13、基于情感词典确定出所述标准训练文本集对应的训练情感得分向量集。
进一步地,所述步骤S12具体包括以下分步骤:
S121、将所述分词处理后的训练文本集中大于所述预设长度的训练文本进行裁剪;
S122、将所述分词处理后的训练文本集中小于所述预设长度的训练文本的前端用0补齐;
S123、将经过步骤S121和步骤S122处理后的训练文本集作为标准训练文本集。
进一步地,所述步骤S13具体包括以下分步骤:
S131、将所述标准训练文本集中每一个词与所述情感词典进行匹配判断,若匹配成功,则执行步骤S132,若匹配不成功,则执行步骤S133;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110997775.0/2.html,转载请声明来源钻瓜专利网。