[发明专利]一种基于推特和历史股价信息的股价趋势预测方法及系统在审

专利信息
申请号: 202110823501.X 申请日: 2021-07-21
公开(公告)号: CN115700621A 公开(公告)日: 2023-02-07
发明(设计)人: 倪茴茴;王书婷;程鹏 申请(专利权)人: 华东师范大学;君烁(上海)信息科技有限公司
主分类号: G06Q10/04 分类号: G06Q10/04;G06Q40/04;G06F40/216;G06F40/289;G06F40/30;G06N3/045
代理公司: 上海德禾翰通律师事务所 31319 代理人: 夏思秋
地址: 200241 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 历史 股价 信息 趋势 预测 方法 系统
【权利要求书】:

1.一种基于推特和历史股价信息的股票趋势预测方法,其特征在于,所述方法包括以下步骤:

步骤(1)、收集目标股票相关的推特数据和历史股价信息,根据价格数据设置股票涨跌标签,并进行初步的数据处理;

步骤(2)、利用改进的TF-IDF算法为分词后的推特文本提取关键词并打分;

步骤(3)、利用提取的关键词和推特之间的交互关系构建推特节点关系图并利用Node2vec将节点图中的推特映射到低维空间向量,获得与目标股票相关的推特嵌入向量;

步骤(4)、通过BERT提取推特中的情感因素,并根据表达的情感强弱为每条文本分配相应的分值;

步骤(5)、将步骤(4)获得的推特情感得分和步骤(3)中提取得到的推特嵌入向量以及步骤(1)中获得的股票涨跌标签一起投入深度学习模型中进行训练测试,预测股价。

2.根据权利要求1所述的股票趋势预测方法,其特征在于,所述步骤(1)的具体步骤包括:

步骤(11)、选定目标股票及待研究的时间区域,获取目标股票在这段时间中的代码、具体日期、开盘价、收盘价、最高价、最低价、成交量;将目标时间段内目标股票的价格数据计算股票的上涨或下跌变化趋势设置为标签;

步骤(12)、选定目标股票的检索关键词,利用推特官方的标签、关键词和推特间回复关系收集与股票相关的推特数据;

步骤(13)、对步骤(11)和步骤(12)获得的数据进行分词和名词短语提取。

3.根据权利要求1所述的股票趋势预测方法,其特征在于,所述步骤(2)的具体步骤包括:

利用改进的TF-IDF算法为每条推特提取关键词并计算其重要性,将tnidfe,j记作推特关键词e在所处推特文本tj中的得分,T为选用的推特的总量,那么其中分母部分反映了包含关键词e的推特的数量;所述提取的关键词包括形容词和名词;所述j表示推特文本序列号,ne,j表示第j个推特中关键词e的个数,tj表示第j个推特文本的内容。

4.根据权利要求3所述的股票趋势预测方法,其特征在于,所述改进的TF-IDF统计方法用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度;所述字词的重要性随着它在文件或语料库中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降;与传统的TF-IDF算法相比,所述改进的TF-IDF算法将式子分子中的文本中包含的词汇频度改成了文本中包含的词汇个数。

5.根据权利要求1所述的股票趋势预测方法,其特征在于,所述步骤(3)的具体步骤包括:

步骤(31)、通过步骤(2)得到推特的关键词合集E和对应的得分W,再联合推特合集T构建推特节点关系图G=(T,E,W),将推特节点和其中包含的关键词节点分别进行连接,并对连接的边赋予对应的得分;

步骤(32)、在推特节点图中同时反映了推特之间存在的交互关系,对于有交互关系的推特赋予相连的边,并设置边权重为1;所述交互关系包括评论、回复;所述交互关系通过推特唯一ID、是否为回复推文、回复原推特ID三个属性提取;

步骤(33)、得到推特节点图后,通过Node2vec来对图中的节点进行嵌入编码;Node2vec算法综合考虑了深度优先游走和广度优先游走两种游走策略,引入了两个参数p和q来控制选择随机游走策略的概率;对于推特节点图中不同的节点类型,包括推特节点、关键词节点,区别对待,在生成游走序列时只考虑推特节点。

6.根据权利要求5所述的股票趋势预测方法,其特征在于,P为与当前节点curr相连的各个节点的游走概率,由参数p和q和边权W控制,具体的计算方法如下:

设t为curr的前序节点,x为curr实际上游走的后序节点,那么Node2vec设置的游走偏移通过来计算,其中dtx为t和x两个节点的跳数距离;那么对于当前节点curr来说后序节点是x的游走概率P则用计算,其中ωcurrx是节点curr和节点x相连的边的权重,Z是一个常量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学;君烁(上海)信息科技有限公司,未经华东师范大学;君烁(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110823501.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top