[发明专利]资产配置方法和装置在审
申请号: | 202011305068.2 | 申请日: | 2020-11-20 |
公开(公告)号: | CN112419069A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 谭文清;朱代辉;李耀明 | 申请(专利权)人: | 上海叮诺科技有限公司 |
主分类号: | G06Q40/06 | 分类号: | G06Q40/06;G06N3/04;G06N3/08 |
代理公司: | 北京华智则铭知识产权代理有限公司 11573 | 代理人: | 姜子朋 |
地址: | 200082 上海市杨浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 资产 配置 方法 装置 | ||
1.一种资产配置方法,其特征在于,所述方法包括:
数据收集步骤:从数据库中提取需要配置的资产类别所对应的特征数据;其中,所述资产类别至少为两种;
数据预处理步骤:对所述特征数据进行预处理,包括清洗数据、填充空值以及标准化处理;
特征提取步骤:采用特征提取网络对经过预处理的所述特征数据进行特征提取,获得有效特征;
策略输出步骤:将所述有效特征输入策略网络,得到输出的正态分布参数以及价值函数;
参数训练步骤:基于历史数据利用强化学习算法对所述特征提取网络和所述策略网络的参数进行训练;
生成配置步骤:将经过预处理的所述特征数据输入到训练完成的所述特征提取网络和所述策略网络,获得资产配置权重。
2.如权利要求1所述的方法,其特征在于,所述策略网络包括第一全连接神经网络和第二全连接神经网络,所述策略输出步骤包括:
将所述有效特征输入所述第一全连接神经网络,得到所述第一全连接神经网络输出的以μ为均值以σ为标准差的正态分布参数;
从所述正态分布中抽样得到动作向量at,利用softmax函数将at转化为配置向量wt,其中
将所述有效特征输入所述第二全连接神经网络,得到所述第二全连接神经网络价值函数vt。
3.如权利要求2所述的方法,其特征在于,所述参数训练步骤包括:
初始化所述策略网络的策略参数θ0,设置对未来奖励的折现因子γ和缓存空间容量为m个元组,将初始化策略网络V0拷贝得到静态网络V1;
获取所述资产类别的初始各类资产状态s0;
将所述资产状态st输入所述策略网络,得到正态分布N(μt,σt),从N(μt,σt)中抽样得到wt,计算得到动作at=softmax(wt);
执行动作at得到t时刻的奖励函数rt+1和下一期的资产状态st+1;在缓存空间中存储元组(st,at,rt+1,st+1);
当所述缓存空间被占满时,从所述缓存空间中采集m个元组,基于所述m个元组,并令yt=rt+1+γVt(st+1),计算损失函数:
其中,Aθ’(st,at)=yt-V′t(st);St是各个资产类别在t时刻的状态;at是所述策略网络输出的t时刻的资产配置权重;γ是对未来奖励的折现因子;vt是在t时刻的价值函数;
利用梯度下降法更新所述策略参数
4.如权利要求1所述的方法,其特征在于,所述特征提取网络为长短期记忆网络或卷积神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海叮诺科技有限公司,未经上海叮诺科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011305068.2/1.html,转载请声明来源钻瓜专利网。