[发明专利]构建模型的方法、装置、电子设备和存储介质在审
申请号: | 202110262260.6 | 申请日: | 2021-03-10 |
公开(公告)号: | CN112990480A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 江攀;叶舟 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 模型 方法 装置 电子设备 存储 介质 | ||
本发明实施例提出了一种构建模型方法、装置、电子设备和存储介质。本发明实施例的构建模型方法包括:获取目标参数;根据目标参数和自动特征选择模型选择与所述目标参数相关的目标特征,所述特征选择模型以经过用户授权的用户数据为训练数据采用强化学习算法训练获得,所述用户数据包括嵌入向量和特征,所述嵌入向量通过特征提取模型从用户行为数据中提取,用于表征用户行为,所述特征经过预先标注,所述嵌入向量和所述特征预先存储在数据库中;以所述目标参数相关的目标特征为输入,目标参数为输出训练模型,以确定目标模型。本发明实施例的构建模型的方法通过嵌入向量来确定目标特征,能够提高模型训练的效率。
技术领域
本发明实施例涉及计算机技术领域,具体而言,涉及一种构建模型的方法、装置、电子设备和存储介质。
背景技术
随着电子技术迅速发展,用户行为在网络上产生庞大的数据。通过数据分析能把隐藏在一大批看来杂乱无章的数据中的信息集中和提炼出来,从而找出所研究对象的内在规律。通常会通过构建数据模型来对数据进行分析。然而,在数学模型训练的过程中,模型的开发周期很长,效率低,因此需要一种能够自动化构建模型的方法。
发明内容
本发明实施例正是基于上述问题,提出了一种新的技术方案,通过根据特征选择模型确定与目标参数相关的目标特征,根据目标特征训练目标模型。能够实现特征的自动化选择,提高模型的训练效率。
根据本发明实施例的第一方面,提出了一种构建模型方法,所述构建模型方法包括:
获取目标参数,所述目标参数用于表征与用户相关的行为偏好;
根据目标参数和自动特征选择模型选择与所述目标参数相关的目标特征,所述特征选择模型以经过用户授权的用户数据为训练数据采用强化学习算法训练获得,所述用户数据包括嵌入向量和特征,所述嵌入向量通过特征提取模型从用户行为数据中提取,用于表征用户行为,所述特征为经过预先标注的用户属性,所述嵌入向量和所述特征预先存储在数据库中;以及
以所述目标参数相关的目标特征为输入,目标参数为输出训练模型,以确定目标模型,所述目标模型用于预测用户的行为。
优选地,提取所述嵌入向量包括:
根据用户行为数据确定用户的时序矩阵;
将所述时序矩阵进行嵌入处理,以生成初始向量;
将所述初始向量进行卷积操作,以生成多个卷积向量;
将多个所述卷积向量进行全局平均池化以及全连接,以提取嵌入向量。
优选地,所述嵌入处理包括:CBOW算法和Skip-Gram算法处理所述时序矩阵。
优选地,所述卷积操作包括:
将所述扩展向量进行卷积降维处理;以及
将降维处理得到的向量进行多维卷积,以生成多个不同的卷积向量。
优选地,所述以所述目标参数相关的目标特征为输入,目标参数为输出训练模型,包括:
采用网格搜索、随机搜索以及贝叶斯优化中的任一方法自动调参。
优选地,所述方法还包括:
响应于模型衰减小于预定阈值,自动更新所述目标模型;以及
响应于模型衰减大于预定阈值,再次根据目标参数和自动特征选择模型选择与所述目标参数相关的目标特征,以再次训练目标模型。
根据本发明实施例的第三方面,提出了一种构建模型装置,所述装置包括:
参数获取单元,用于获取目标参数,所述目标参数用于表征与用户相关的行为偏好;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110262260.6/2.html,转载请声明来源钻瓜专利网。