[发明专利]基于强化学习的特征提取方法、装置和计算机设备有效
申请号: | 201910899003.6 | 申请日: | 2019-09-23 |
公开(公告)号: | CN110796261B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 陈尧 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/092;G06Q40/08 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 关志琨 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 特征 提取 方法 装置 计算机 设备 | ||
本申请涉及一种基于强化学习的特征提取方法、装置和计算机设备,所述方法包括:获取学习对象的特征提取代码;所述特征提取代码根据人工编写确定;根据所述特征提取代码,获取所述学习对象的状态特征;采用所述状态特征训练基于强化学习的深度网络结构;获取训练后的深度网络结构的最优网络结构和最优权重参数;根据所述最优网络结构和所述最优权重参数,生成最优特征提取策略;所述最优特征提取策略用于提取保险业务用户的画像特征,以便根据所述画像特征解析所述保险业务用户的投保需求。采用本方法,设置特征提取代码应用于模型训练,可提高特征提取效率,即以建模效果作为学习奖励激发计算机不断优化学习策略,以学习到新的特征提取方式。
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于强化学习的特征提取方法、装置、计算机可读存储介质和计算机设备。
背景技术
强化学习又称为试错学习,是一种让智能体(agent)在学习对象的环境中不断交互,并根据环境的反馈激励(reward)进行学习的一种机器学习算法,该学习算法不基于任何先验知识,可以完全自主学习。根据学习对象的不同,可以有不同的智能体,例如学习对象为保险业务时,智能体可以是保险业务中的参保用户等。
传统的强化学习例如Deep Q Network(DQN)在训练自身的神经网络模型时,完全根据机器通过自主学习得到的数据作为训练数据,并未针对不同场景设置训练模型所用特征的最优提取路径,而是采用人工提取方式提取特征,不仅费时费力,还导致模型训练效果不佳。
发明内容
基于此,有必要针对现有技术中模型训练所用特征提取效率低的技术问题,提供一种基于强化学习的特征提取方法、装置、计算机可读存储介质和计算机设备。
一方面,本发明实施例提供一种基于强化学习的特征提取方法,包括:获取学习对象的特征提取代码;所述特征提取代码根据人工编写确定;根据所述特征提取代码,获取所述学习对象的状态特征;采用所述状态特征训练基于强化学习的深度网络结构;获取训练后的深度网络结构的最优网络结构和最优权重参数;根据所述最优网络结构和所述最优权重参数,生成最优特征提取策略;所述最优特征提取策略用于提取保险业务用户的画像特征,以便根据所述画像特征解析所述保险业务用户的投保需求。
另一方面,本发明实施例提供一种基于强化学习的特征提取装置,包括:代码获取模块,用于获取学习对象的特征提取代码;所述特征提取代码根据人工编写确定;特征获取模块,用于根据所述特征提取代码,获取所述学习对象的状态特征;结构训练模块,用于采用所述状态特征训练基于强化学习的深度网络结构;结果获取模块,用于获取训练后的深度网络结构的最优网络结构和最优权重参数;策略生成模块,用于根据所述最优网络结构和所述最优权重参数,生成最优特征提取策略;所述最优特征提取策略用于提取保险业务用户的画像特征,以便根据所述画像特征解析所述保险业务用户的投保需求。
又一方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取学习对象的特征提取代码;所述特征提取代码根据人工编写确定;根据所述特征提取代码,获取所述学习对象的状态特征;采用所述状态特征训练基于强化学习的深度网络结构;获取训练后的深度网络结构的最优网络结构和最优权重参数;根据所述最优网络结构和所述最优权重参数,生成最优特征提取策略;所述最优特征提取策略用于提取保险业务用户的画像特征,以便根据所述画像特征解析所述保险业务用户的投保需求。
又一方面,本发明实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取学习对象的特征提取代码;所述特征提取代码根据人工编写确定;根据所述特征提取代码,获取所述学习对象的状态特征;采用所述状态特征训练基于强化学习的深度网络结构;获取训练后的深度网络结构的最优网络结构和最优权重参数;根据所述最优网络结构和所述最优权重参数,生成最优特征提取策略;所述最优特征提取策略用于提取保险业务用户的画像特征,以便根据所述画像特征解析所述保险业务用户的投保需求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910899003.6/2.html,转载请声明来源钻瓜专利网。