[发明专利]一种基于推特和历史股价信息的股价趋势预测方法及系统在审
申请号: | 202110823501.X | 申请日: | 2021-07-21 |
公开(公告)号: | CN115700621A | 公开(公告)日: | 2023-02-07 |
发明(设计)人: | 倪茴茴;王书婷;程鹏 | 申请(专利权)人: | 华东师范大学;君烁(上海)信息科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/04;G06F40/216;G06F40/289;G06F40/30;G06N3/045 |
代理公司: | 上海德禾翰通律师事务所 31319 | 代理人: | 夏思秋 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 历史 股价 信息 趋势 预测 方法 系统 | ||
1.一种基于推特和历史股价信息的股票趋势预测方法,其特征在于,所述方法包括以下步骤:
步骤(1)、收集目标股票相关的推特数据和历史股价信息,根据价格数据设置股票涨跌标签,并进行初步的数据处理;
步骤(2)、利用改进的TF-IDF算法为分词后的推特文本提取关键词并打分;
步骤(3)、利用提取的关键词和推特之间的交互关系构建推特节点关系图并利用Node2vec将节点图中的推特映射到低维空间向量,获得与目标股票相关的推特嵌入向量;
步骤(4)、通过BERT提取推特中的情感因素,并根据表达的情感强弱为每条文本分配相应的分值;
步骤(5)、将步骤(4)获得的推特情感得分和步骤(3)中提取得到的推特嵌入向量以及步骤(1)中获得的股票涨跌标签一起投入深度学习模型中进行训练测试,预测股价。
2.根据权利要求1所述的股票趋势预测方法,其特征在于,所述步骤(1)的具体步骤包括:
步骤(11)、选定目标股票及待研究的时间区域,获取目标股票在这段时间中的代码、具体日期、开盘价、收盘价、最高价、最低价、成交量;将目标时间段内目标股票的价格数据计算股票的上涨或下跌变化趋势设置为标签;
步骤(12)、选定目标股票的检索关键词,利用推特官方的标签、关键词和推特间回复关系收集与股票相关的推特数据;
步骤(13)、对步骤(11)和步骤(12)获得的数据进行分词和名词短语提取。
3.根据权利要求1所述的股票趋势预测方法,其特征在于,所述步骤(2)的具体步骤包括:
利用改进的TF-IDF算法为每条推特提取关键词并计算其重要性,将tnidfe,j记作推特关键词e在所处推特文本tj中的得分,T为选用的推特的总量,那么其中分母部分反映了包含关键词e的推特的数量;所述提取的关键词包括形容词和名词;所述j表示推特文本序列号,ne,j表示第j个推特中关键词e的个数,tj表示第j个推特文本的内容。
4.根据权利要求3所述的股票趋势预测方法,其特征在于,所述改进的TF-IDF统计方法用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度;所述字词的重要性随着它在文件或语料库中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降;与传统的TF-IDF算法相比,所述改进的TF-IDF算法将式子分子中的文本中包含的词汇频度改成了文本中包含的词汇个数。
5.根据权利要求1所述的股票趋势预测方法,其特征在于,所述步骤(3)的具体步骤包括:
步骤(31)、通过步骤(2)得到推特的关键词合集E和对应的得分W,再联合推特合集T构建推特节点关系图G=(T,E,W),将推特节点和其中包含的关键词节点分别进行连接,并对连接的边赋予对应的得分;
步骤(32)、在推特节点图中同时反映了推特之间存在的交互关系,对于有交互关系的推特赋予相连的边,并设置边权重为1;所述交互关系包括评论、回复;所述交互关系通过推特唯一ID、是否为回复推文、回复原推特ID三个属性提取;
步骤(33)、得到推特节点图后,通过Node2vec来对图中的节点进行嵌入编码;Node2vec算法综合考虑了深度优先游走和广度优先游走两种游走策略,引入了两个参数p和q来控制选择随机游走策略的概率;对于推特节点图中不同的节点类型,包括推特节点、关键词节点,区别对待,在生成游走序列时只考虑推特节点。
6.根据权利要求5所述的股票趋势预测方法,其特征在于,P为与当前节点curr相连的各个节点的游走概率,由参数p和q和边权W控制,具体的计算方法如下:
设t为curr的前序节点,x为curr实际上游走的后序节点,那么Node2vec设置的游走偏移通过来计算,其中dtx为t和x两个节点的跳数距离;那么对于当前节点curr来说后序节点是x的游走概率P则用计算,其中ωcurrx是节点curr和节点x相连的边的权重,Z是一个常量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学;君烁(上海)信息科技有限公司,未经华东师范大学;君烁(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110823501.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:制冰装置及冰箱
- 下一篇:一种网络攻击检测方法、装置及存储介质
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置