[发明专利]数据处理方法、装置、计算机可读存储介质和计算机设备有效
申请号: | 201910872621.1 | 申请日: | 2019-09-16 |
公开(公告)号: | CN110795232B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 陈尧 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N3/084 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 关志琨 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 计算机 可读 存储 介质 设备 | ||
1.一种虚拟资源的数据处理方法,包括:
获取用户在业务系统中持有的虚拟资源的状态数据;
将所述虚拟资源的状态数据输入至预先训练的策略生成网络;其中,所述预先训练的策略生成网络为待训练的策略生成网络与待训练的对抗策略网络,根据所述虚拟资源的历史状态数据进行对抗训练得到的生成网络;所述策略生成网络用于生成虚拟资源转移策略;所述对抗策略网络用于生成对抗所述策略生成网络的虚拟资源转移策略的对抗转移策略,以使在完成所述虚拟资源转移策略和所述对抗转移策略后,所述用户在所述业务系统中的虚拟资产数值满足预设的变化条件;
根据所述预先训练的策略生成网络的输出结果,生成针对所述虚拟资源的状态数据的目标虚拟资源转移策略,以使所述用户进行与所述目标虚拟资源转移策略相应的虚拟资源转移操作。
2.根据权利要求1所述的方法,其特征在于,还包括:
构建所述待训练的策略生成网络,以及,构建所述待训练的对抗策略网络;
获取所述虚拟资源的历史状态数据;并使用所述虚拟资源的历史状态数据,对所述待训练的策略生成网络和所述待训练的对抗策略网络进行对抗训练,得到所述预先训练的策略生成网络。
3.根据权利要求2所述的方法,其特征在于,所述历史状态数据具有至少两个,所述使用所述虚拟资源的历史状态数据,对所述待训练的策略生成网络和所述待训练的对抗策略网络进行对抗训练,得到所述预先训练的策略生成网络,包括:
将所述历史状态数据,输入至所述待训练的策略生成网络,生成与所述历史状态数据对应的第一虚拟资源转移策略;以及,将所述历史状态数据,输入至所述待训练的对抗策略网络,生成与所述历史状态数据对应的第一对抗转移策略;
确定所述虚拟资源的当前状态数据;所述当前状态数据为在所述业务系统中完成所述第一虚拟资源转移策略和所述第一对抗转移策略后,所述用户在所述业务系统中持有的虚拟资源的状态数据;
根据所述当前状态数据,计算出所述用户的虚拟资产变化值;
根据所述虚拟资产变化值,调整所述待训练的策略生成网络的网络参数,得到训练后的策略生成网络,并将所述训练后的策略生成网络,作为所述待训练的策略生成网络,以及,根据所述虚拟资产变化值,调整所述待训练的对抗策略网络的网络参数,得到训练后的对抗策略网络,并将所述训练后的对抗策略网络作为所述待训练的对抗策略网络;
重复执行上述步骤,直至得到所述预先训练的策略生成网络。
4.根据权利要求3所述的方法,其特征在于,所述根据所述虚拟资产变化值,调整所述待训练的策略生成网络的网络参数,得到训练后的策略生成网络,包括:
获取所述待训练的策略生成网络的第一目标虚拟资产变化值;
计算所述第一目标虚拟资产变化值与所述虚拟资产变化值的误差,作为所述待训练的策略生成网络的第一损失参数;
根据所述第一损失参数,对所述待训练的策略生成网络的网络参数进行求偏导,得到针对所述待训练的策略生成网络的网络参数的第一偏导数;
根据所述第一偏导数,更新所述待训练的策略生成网络的网络参数,得到所述训练后的策略生成网络。
5.根据权利要求3所述的方法,其特征在于,所述根据所述虚拟资产变化值,调整所述待训练的对抗策略网络的网络参数,得到训练后的对抗策略网络,包括:
获取所述待训练的对抗策略网络的第二目标虚拟资产变化值;
计算所述第二目标虚拟资产变化值与所述虚拟资产变化值的误差,作为所述待训练的对抗策略网络的第二损失参数;
根据所述第二损失参数,对所述待训练的对抗策略网络的网络参数进行求偏导,得到针对所述待训练的对抗策略网络的网络参数的第二偏导数;
根据所述第二偏导数,更新所述待训练的对抗策略网络的网络参数,得到所述训练后的对抗策略网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910872621.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种虚拟CPU的处理方法及装置
- 下一篇:分布式资源配给方法、装置和电子设备