[发明专利]基于媒体信息张量监督学习的股票价格波动预测系统及方法在审
申请号: | 201710596662.3 | 申请日: | 2017-07-20 |
公开(公告)号: | CN107392664A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 李庆;蒋李灵 | 申请(专利权)人: | 西南财经大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q40/04 |
代理公司: | 成都金英专利代理事务所(普通合伙)51218 | 代理人: | 袁英 |
地址: | 611130 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 媒体 信息 张量 监督 学习 股票价格 波动 预测 系统 方法 | ||
技术领域
本发明涉及一种股票价格波动预测系统及方法,尤其涉及一种基于媒体信息张量监督学习的股票价格波动预测系统及方法。
背景技术
随着信息技术的发展,互联网媒体逐渐成为主流的媒体形式。特别是以博客、微博、社会化新闻、维基百科和网络论坛为主的社会化媒体的兴起,其媒体影响力日益加剧。海量信息和裂变式传播使互联网媒体对股票市场产生了举足轻重的影响。
现有技术中,对股票价格波动进行预测时大都考虑互联网媒体中的量化信息,如股票的交易价格等,而忽略定性的信息,如公司的新闻等,导致股票价格波动预测不精确。
当结合不同纬度信息预测股票价格波动时,现有技术是将不同维度的信息特征值拼接为一个超级特征向量,然后运用基于向量预测模型去探测互联网媒体信息对股市的影响。但是,由于不同维度的信息是交互影响,并且紧密相关、互为补充,将不同维度的信息之间的关联隔断后直接拼接成一为一个超级特征向量,这样容易出现维度灾难。维度灾难,即在机器学习算法中输入的属性向量长度过长,导致算法性能不再随信息量的增多而提高,反而使算法效果降低。并且在拼接超级特征向量的时候,认为不同维度的信息特征是相互独立的,减弱了不同维度信息特征间的相互作用,甚至是忽略了他们之间的联系。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于媒体信息张量监督学习的股票价格波动预测系统及方法,以解决现有的股票价格波动预测精度低的问题。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,提供一种基于媒体信息张量监督学习的股票价格波动预测方法,其包括:
S1、收集市场交易信息、媒体新闻信息、股民情感信息;
进一步地,市场交易信息来自于公司的基本数据,如股票的交易价格、公司的规模、交易数量等信息,能从数据的角度反应公司目前的运作情况。新闻媒体信息来自于日常股票新闻,包含了公司基本情况的内容,能让投资者获取丰富的信息,全面了解公司的情况,包含消极或者积极的内容,容易影响投资者非理性投资。股民情感信息来自于股票论坛等社交媒体,通过社交媒体中的情感词来捕捉社会情绪。
S2、对收集的信息进行预处理;
可选地,预处理包括对收集的媒体新闻信息进行文本处理,对收集的股民情感信息进行情感分析。
S3、基于预处理后的信息构建张量;
本发明用张量表示不同维度的信息,其中包括市场交易信息、媒体新闻信息、股民情感信息。
其中,市场交易信息维度通过对市场交易信息组合进行向量化。媒体新闻信息维度通过构造新闻词库,新闻词库由新闻中的名词和情感词构成。新闻通过与词库对比,再加上对应词的权重,最后把新闻文本信息转换为向量。股民情感信息维度通过计算两个情感因子来表示股民情感信息,即公众对单支股票的情感因子和公众对整个市场的情感因子。基于市场交易信息维度、媒体新闻信息维度、股民情感信息维度构建三阶张量,以保留不同维度间的关系以及维度间相互作用的潜在信息。
张量Xt表示时间t时投资者所处的投资坏境。张量Xt∈ℝI1×I2×I3表示媒体信息空间,其I1、I2、I3表示张量每一阶的维数,即股票市场信息有I1个属性值,媒体新闻信息有I2个属性值,股民情感信息有I3个属性值。t表示第t个张量样本,对应于股票市场可以表示时间t投资者所后去的媒体信息,即对不同样本设置的下标。ai1,i2,i3表示张量X中某一个元素值,其对应为第一阶维度下标为i1,第二阶维度下标为i2,第三阶维度下标为i3的元素。关于第t个张量样本Xt的构造如下:
ai1,1,1,1≤i1≤I1表示市场交易信息维度,该维度的属性值个数有I1个。
a2, i2,2,1≤i2≤I2表示媒体新闻信息维度,该维度的属性值个数有I2个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南财经大学,未经西南财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710596662.3/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置