[发明专利]一种情感倾向分析方法及系统在审
申请号: | 202110137402.6 | 申请日: | 2021-02-01 |
公开(公告)号: | CN112925906A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 潘钰;刘远;杨森 | 申请(专利权)人: | 北京明略昭辉科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/951;G06F40/205;G06F40/247;G06F40/284;G06F40/289;G06F40/30;G06Q10/04;G06Q40/04 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 赵燕 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 情感 倾向 分析 方法 系统 | ||
本申请公开了一种情感倾向分析方法及系统。情感倾向分析方法包括:爬取步骤:爬取舆情文本,获取爬取后的舆情文本;预处理步骤:预处理爬取后的所述舆情文本,获取预处理后的舆情文本;获取步骤:使用预处理后的所述舆情文本,获取word2vec词向量模型后,对所述word2vec词向量模型中的向量进行情感倾向分类,获取情感倾向分类器;分析步骤:通过所述情感倾向分类器去分析实时舆情文本的情感倾向。本发明提出一种情感倾向分析方法及系统,本发明通过对海量网络舆情的分析可以挖掘出舆情数据背后的情感倾向,进而会较为真实地反应一定时间内股价的走势情况,并定性获取对股价的涨跌预测,提高了对情感倾向分析的准确率。
技术领域
本申请涉及情感倾向分析技术领域,尤其涉及一种情感倾向分析方法及系统。
背景技术
随着科技的进步与社会的发展,股票市场已经在我国现代金融体系中占主导地位,网络用户作为信息网络的主力军也越发倾向于在一系列社交网络平台上交流个人经验、抒发自身情感,逐步由资源信息查阅者向数据资源分享者的角色转变。用户个体发表的金融股票评论、新闻时事评论等舆情信息,在一定程度上促进了互联网线上数据的蓬勃发展,加快了网络舆情数据的繁衍与裂变。在互联网急剧扩展的浪潮中股民投资者作为股票市场的重要组成部分已经发展为网络在线分享交流股市资讯的重要参与者之一,由此产生的股评舆情数据对股票市场的发展带来了不可忽视的影响。对股票的预测方法一般分为技术分析与基本面分析两种。技术分析基于对股市运行所积累的结构化数据对未来走势进行分析预测,因为影响股价的所有因素都集中反映在历史数据中,因此对历史数据进行充分分析便可以较好地预测股票的发展势头;基本面分析则多使用非结构化文本数据,数据来源更广也更复杂,其着重分析影响股市的各项外部因素,从宏观的政治因素到微观的企业新闻公告都可以包含其中,目前股票新闻在股价预测方面的应用较为广泛。但是依然没有考虑网络舆情对股价的影响。现有的对股价预测的技术如下,基于股市运行所积累的结构化数据对未来走势进行分析预测以及基于对股票相关新闻的分析对股票价格进行预测。但是目前的方法都存在一定的缺陷和局限性,由于股票市场的复杂性,单纯的基于历史股价的结构化数据和基于股票新闻的非结构化数据的研究,无法准确的预测股价,无法解释诸如“股票溢价”、“股价过度波动”等股市异象,无法满足人们研究金融股票市场境况的需求。随着股民的增多,相当一部分的股民并非绝对理性的,在股吧中股民对股票的投资分享可能会影响其他股民的投资行为,从而最终反映在股价波动中。
因此,针对以上现状,本发明提出一种情感倾向分析方法及系统,本发明通过对海量网络舆情的分析可以挖掘出舆情数据背后的情感倾向,进而会较为真实地反应一定时间内股价的走势情况,并定性获取对股价的涨跌预测,提高了对股价预测的准确率。并且本发明的研究对象为网络舆情,模型基础为LSTM神经网络,该网络适宜处理时序数据,持续性保留文本模型与股票预测模型中的长时依赖关系,发掘深层次信息,同时,通过对舆情情感倾向性进行情绪极性划分,进而得出在舆情趋势下,股价的涨跌情况,为入门级股民提供投资参考,也可为基于历史股价的定量预测提供帮助。
发明内容
本申请实施例提供了一种情感倾向分析方法及系统,以至少解决相关技术中主观因素影响的问题。
本发明提供了一种情感倾向分析方法,包括:
爬取步骤:爬取舆情文本,获取爬取后的舆情文本;
预处理步骤:预处理爬取后的所述舆情文本,获取预处理后的舆情文本;
获取步骤:使用预处理后的所述舆情文本,获取word2vec词向量模型后,对所述word2vec词向量模型中的向量进行情感倾向分类,获取情感倾向分类器;
分析步骤:通过所述情感倾向分类器去分析实时舆情文本的情感倾向。
上述的情感倾向分析方法,所述爬取步骤包括,选取所述舆情文本作为挖掘与分析的对象,并爬取所述舆情文本,获取爬取后的所述舆情文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略昭辉科技有限公司,未经北京明略昭辉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110137402.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种受流器
- 下一篇:硫化铜的应用、硫化铜纳米复合材料及其制备方法与应用