[发明专利]一种基于深度强化学习A3C算法的金融交易方法在审

专利信息
申请号: 201910104407.1 申请日: 2019-02-01
公开(公告)号: CN109816530A 公开(公告)日: 2019-05-28
发明(设计)人: 郑子彬;郑万山 申请(专利权)人: 中山大学
主分类号: G06Q40/04 分类号: G06Q40/04;G06Q10/06;G06N3/04
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 林丽明
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于深度强化学习A3C算法的金融交易方法,所述方法包括:构建模拟交易环境,采集历史分钟数据并预处理,得到待输入向量;初始化A3C模型;工作者线程与模拟交易环境的副本交互,并将待执行的动作发送到模拟交易环境的副本;模拟交易环境的副本接跳转到下一个交易状态,计算奖赏值,将下一交易状态和奖赏值发送至智能交易体;交易智能体分别计算工作者线程的策略网络和评估网络的权值梯度并发送至全局网络;全局网络更新权值,重复工作线程的交互直到A3C模型训练完毕;使用全局网络对待执行的交易操作进行选择。本发明通过市场历史数据不断地交互训练模型,得到稳定的交易策略,避免引入大量的专家知识,动态适应环境变化并更新策略。
搜索关键词: 模拟交易 全局网络 副本 交易状态 金融交易 强化学习 线程 算法 奖赏 预处理 发送 策略网络 动态适应 更新策略 工作线程 环境变化 交互训练 交易操作 交易策略 历史数据 模型训练 评估网络 输入向量 智能交易 专家知识 初始化 智能体 构建 跳转 采集 引入 重复 更新 交易
【主权项】:
1.一种基于深度强化学习A3C算法的金融交易方法,其特征在于,所述方法包括以下步骤:S1:构建模拟交易环境,通过模拟交易环境的数据接口采集金融市场的历史分钟数据,将历史分钟数据进行缺省值处理完毕后,再做归一化处理,得到历史分钟数据指标;同时分别计算按分钟的简单移动平均指标和按分钟的指数移动平均指标,将归一化处理后的历史分钟数据指标和按分钟的简单移动平均指标、按分钟的指数移动平均指标组合得到待输入向量;S2:初始化包含在智能交易体中的A3C模型,所述A3C模型包含有一个全局网络和若干工作者线程,所述全局网络的结构和每一个工作者线程的结构均相同;所述工作者线程均包括有评估网络和策略网络,所述评估网络和策略网络共用若干隐含层;所述A3C模型创建工作者线程时,模拟交易环境同时创建模拟交易副本;所述待输入向量通过输入层输入至工作者线程,然后通过若干隐含层处理,隐含层的最终输出分别输入至策略网络和评估网络,策略网络和评估网络分别对应输出策略网络输出向量和评估网络输出向量,所述若干工作者线程输出的策略网络输出向量和评估网络输出向量共同作为全局网络的输入,所述全局网络的输入经过全局网络的处理最终得到全局网络的输出;所述全局网络的权值使用随机初始化,每一个工作者线程的网络权重与全局网络权重同步初始化;S3:每一个工作者线程与一个模拟交易环境的副本进行交互,所述模拟交易环境副本的数目与工作者线程的数目相同;利用工作者线程中策略网络的输出向量和评估网络输出值计算需要执行的交易动作,并将动作发送到模拟交易环境的副本;S4:模拟交易环境的副本接收到交易动作,跳转到下一个交易状态st+1,根据交易动作前后的交易状态计算奖赏值rt,奖赏值计算完成后,模拟交易环境的副本将下一交易状态st+1和奖赏值rt发送到交易智能体;S5:交易智能体接收到st+1和rt,分别计算工作者线程的策略网络权值梯度和评估网络权值梯度,每个工作者线程将各自的策略网络权值梯度和评估网络权值梯度发送至全局网络;S6:全局网络接收到各工作者发送的策略网络权值梯度和评估网络权值梯度后,更新全局网络的网络权值,全局网络权值更新完成后,以st+1作为工作者线程的新的输入,重复步骤S3直到达到设定的步数或累计奖赏收敛,此时A3C模型训练完毕;S7:A3C模型训练完毕后,使用全局网络对待执行的交易操作进行选择,模拟交易环境从交易所接收行情数据,计算待输入向量作为全局网络输入,根据全局网络中策略网络输出的最大概率值选取下一目标持仓量,通过ctp自动化交易接口下订单使得当前仓位达到目标仓位。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910104407.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top