[发明专利]一种基于新闻特征抽取和循环神经网络的股票涨跌预测方法在审

申请号：	201910454176.7	申请日：	2019-05-29
公开（公告）号：	CN110334848A	公开（公告）日：	2019-10-15
发明（设计）人：	黄丽明;闫宏飞	申请（专利权）人：	北京大学
主分类号：	G06Q10/04	分类号：	G06Q10/04;G06Q40/04;G06F16/906;G06F16/9535;G06N3/04
代理公司：	北京君尚知识产权代理事务所(普通合伙) 11200	代理人：	司立彬
地址：	100871 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	预测文档循环神经网络股票差分序列股票涨跌特征抽取文档集合预测模型单词价格序列神经网络输入循环查询
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于新闻特征抽取和循环神经网络的股票涨跌预测方法，其步骤包括：

1)准备大量与股票相关的文档集合D，根据文档集合D生成一单词表V；

2)设置利好种子集P_seed和利空种子集N_seed，并在文档集合D上进行计算得到最优标准集P^*和N^*；

3)对文档集合D进行查询，得到所有包含待预测股票名称的文档集合，其中，该文档集合中第i个交易日的文档doc_i为一个单词序列为文档doc_i中第n_i个单词；

4)利用最优标准集P^*和N^*计算该单词表V中每一单词w的利好极性polar(w)；然后根据各文档中单词的利好极性生成对应文档的新闻特征；其中，文档doc_i的新闻特征为f(doc_i)；

5)根据该待预测股票在过去连续一段交易日内的价格序列生成一差分序列；

6)将步骤4)得到的各文档的新闻特征和步骤5)得到的差分序列输入循环神经网络，训练得到一预测模型；

7)利用训练好的该预测模型预测该待预测股票的涨跌。

2.如权利要求1所述的方法，其特征在于，所述利好极性其中，P^*为最优标准利好集，N^*为最优标准利空集，pmi(w,v)为单词w和单词v之间的点互信息，最优标准利好集P^*和最优标准利空集N^*的单词总数分别为K和J。

3.如权利要求2所述的方法，其特征在于，获取最优标准利好集P^*和最优标准利空集N^*的方法为：首先定义标准利好集P和标准利空集N，以及单词w在P和N上的利好极性polar(w)；其中，P_std＝{w_p1,w_p2,…,w_pK}，N_std＝{w_n1,w_n2,…,w_nJ}，P_std为一组数量为K的未知的利好标准单词，N_std为一组数量为J的未知的利空标准单词；然后根据公式

s.t.|P_std|＝K,|N_std|＝J，求解得到最优标准集P^*和N^*。

4.如权利要求3所述的方法，其特征在于，求解得到最优标准集P^*和N^*的方法为：定义单词在种子集合上的极性为通过求解公式s.t.|P_std|＝K,|N_std|＝J得到单词表V中的任意单词w的利好极性polar_seed(W)；然后将单词表V中所有的M个单词按照单词的polar_seed(W)从大到小排序，将该排序的序列中前K个单词构成最优标准利好集P^*，该序列中的后J个单词构成最优标准利空集N^*。

5.如权利要求1所述的方法，其特征在于，所述步骤2)中，将利好极性数值范围划分为L段，然后根据文档中各分段中的单词生成该文档的新闻特征，文档doc_i的新闻特征f(doc_i)＝(x_i1,x_i2,…,x_iL)^T，I_j为属于第j段利好极性数值范围，polar(w_k)为第k个单词w_k的利好极性polar(w)。

6.如权利要求1所述的方法，其特征在于，所述步骤1)中，根据交易日对查询的新闻进行划分并生成文档，其中doc_i为第i个交易日的新闻对应的文档。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京大学，未经北京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910454176.7/1.html，转载请声明来源钻瓜专利网。

上一篇：基于改进K-means聚类与支持向量机的风功率预测方法
下一篇：基于数据监控的资源预警方法、装置和计算机设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政；管理
G06Q10-02 .预定，例如用于门票、服务或事件的
G06Q10-04 .预测或优化，例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理，例如组织、规划、调度或分配时间、人员或机器资源；企业规划；组织模型
G06Q10-08 .物流，例如仓储、装货、配送或运输；存货或库存管理，例如订货、采购或平衡订单
G06Q10-10 .办公自动化，例如电子邮件或群件的计算机辅助管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于新闻特征抽取和循环神经网络的股票涨跌预测方法在审

专利文献下载