[发明专利]模型训练方法、装置及存储介质有效
申请号: | 201910555812.5 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110276404B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 黄超;荆彦青 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种模型训练方法、装置及存储介质,属于计算机技术领域。该方法包括:获取多个第一样本数据;获取初始化的网络模型;根据多个第一样本数据对网络模型进行训练;获取多个第二样本数据;根据多个第二样本数据和多个第二样本数据对应的目标收益数值,对已根据多个第一样本数据训练完成的网络模型进行训练。本发明实施例提供了一种模型训练的方案,避免了由于录制得到的样本数据的数量有限而导致网络模型准确率不高的问题,提高了网络模型的准确率,基于该网络模型确定将在界面中执行的操作时不易出现错误,提高了网络模型的稳定性。 | ||
搜索关键词: | 模型 训练 方法 装置 存储 介质 | ||
【主权项】:
1.一种模型训练方法,其特征在于,所述方法包括:获取多个第一样本数据,所述第一样本数据通过录制终端的运行过程得到,所述第一样本数据包括第一样本图像和第一目标操作,所述第一样本图像为所述终端显示的界面的图像,所述第一目标操作为在所述界面中执行的操作;获取初始化的网络模型,所述网络模型用于根据任一界面的图像获取多个参考操作对应的操作分值,所述参考操作对应的操作分值用于表示在所述界面中执行所述参考操作的概率;根据所述多个第一样本数据对所述网络模型进行训练;获取多个第二样本数据,所述第二样本数据通过监测所述终端的运行过程得到,所述第二样本数据包括第二样本图像和第二目标操作;根据所述多个第二样本数据和所述多个第二样本数据对应的目标收益数值,对已根据所述多个第一样本数据训练完成的所述网络模型进行训练,所述第二样本数据对应的目标收益数值通过采用参考收益函数,对所述第二样本数据中的第二样本图像和第二目标操作进行处理得到。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910555812.5/,转载请声明来源钻瓜专利网。
- 上一篇:模型建立方法和装置
- 下一篇:用于输出信息的方法和装置