[发明专利]资源生成模型的训练与服务资源的生成方法、装置在审
申请号: | 202110739547.3 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113408641A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 李科浇;周波;王凡;陈永锋;何径舟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 资源 生成 模型 训练 服务 方法 装置 | ||
1.一种资源生成模型的训练方法,包括:
获取训练数据,所述训练数据中包含多个状态特征与多个状态特征的反馈标签;
使用多个状态特征与多个状态特征的反馈标签对第一神经网络模型进行训练,得到环境模型;
根据多个状态特征与所述环境模型,通过强化学习的方式对第二神经网络模型进行训练,得到资源生成模型。
2.根据权利要求1所述的方法,其中,所述使用多个状态特征与多个状态特征的反馈标签对第一神经网络模型进行训练,得到环境模型包括:
对每个状态特征中的预设特征进行调整,得到对应每个状态特征的第一调整特征与第二调整特征;
使用多个状态特征、多个状态特征的第一调整特征、多个状态特征的第二调整特征与多个状态特征的反馈标签对所述第一神经网络模型进行训练,得到所述环境模型。
3.根据权利要求2所述的方法,其中,所述使用多个状态特征、多个状态特征的第一调整特征、多个状态特征的第二调整特征与多个状态特征的反馈标签对所述第一神经网络模型进行训练,得到所述环境模型包括:
针对每个状态特征,将该状态特征、该状态特征的第一调整特征与第二调整特征分别输入所述第一神经网络模型,得到所述第一神经网络模型输出的反馈结果、第一反馈结果与第二反馈结果;
根据每个状态特征的反馈结果、每个状态特征的第一调整特征的第一反馈结果、每个状态特征的第二调整特征的第二反馈结果与状态特征的反馈标签,计算损失函数值;
根据计算得到的损失函数值调整第一神经网络模型中的参数,直至所述第一神经网络模型收敛,得到所述环境模型。
4.根据权利要求1所述的方法,其中,所述根据多个状态特征与所述环境模型,通过强化学习的方式对第二神经网络模型进行训练,得到资源生成模型包括:
将当前状态特征输入所述第二神经网络模型,得到所述第二神经网络模型输出的服务资源结果;
将当前状态特征与当前状态特征的服务资源结果输入所述环境模型,得到所述环境模型输出的第一反馈结果;
使用所述第一反馈结果更新奖励值,根据更新后的奖励值调整所述第二神经网络模型的参数;
返回执行将当前状态特征输入所述第二神经网络模型的操作,直至所述第二神经网络模型的奖励值满足预设条件。
5.根据权利要求4所述的方法,其中,所述使用所述第一反馈结果更新奖励值包括:
将当前状态特征与预设服务资源结果输入所述环境模型,得到所述环境模型输出的第二反馈结果;
根据所述第一反馈结果与所述第二反馈结果更新奖励值。
6.一种服务资源的生成方法,包括:
获取待处理状态特征;
将所述待处理状态特征输入资源生成模型,将所述资源生成模型的输出结果,作为对应所述待处理状态特征的服务资源;
其中,所述资源生成模型是根据权利要求1-5中任一项方法预先训练得到的。
7.一种资源生成模型的训练装置,包括:
第一获取单元,用于获取训练数据,所述训练数据中包含多个状态特征与多个状态特征的反馈标签;
处理单元,用于使用多个状态特征与多个状态特征的反馈标签对第一神经网络模型进行训练,得到环境模型;
训练单元,用于根据多个状态特征与所述环境模型,通过强化学习的方式对第二神经网络模型进行训练,得到资源生成模型。
8.根据权利要求7所述的装置,其中,所述处理单元在使用多个状态特征与多个状态特征的反馈标签对第一神经网络模型进行训练,得到环境模型时,具体执行:
对每个状态特征中的预设特征进行调整,得到对应每个状态特征的第一调整特征与第二调整特征;
使用多个状态特征、多个状态特征的第一调整特征、多个状态特征的第二调整特征与多个状态特征的反馈标签对所述第一神经网络模型进行训练,得到所述环境模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110739547.3/1.html,转载请声明来源钻瓜专利网。