[发明专利]模型参数表示空间大小估计方法及装置、推荐方法有效
申请号: | 201910325428.6 | 申请日: | 2019-04-22 |
公开(公告)号: | CN110135465B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 王涌壮;徐宇辉;毛志成;袁镱 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 参数 表示 空间 大小 估计 方法 装置 推荐 | ||
1.一种模型参数表示空间大小估计方法,其特征在于,包括:
获取目标模型的目标参数向量;
统计目标参数向量之间的距离分布;
根据所述距离分布确定所述目标参数向量做聚类的目标阈值;
根据所述目标阈值和目标参数向量之间的距离,估计所述目标模型的参数向量的表示空间大小;
其中,获取目标模型的目标参数向量,包括:
在多台服务器上并行训练所述目标模型,以使所述目标模型达到稳定状态;
在每台服务器上保存所述目标模型的部分模型参数;
采样所述多台服务器中的全部服务器上的模型参数或部分服务器上的部分模型参数作为所述目标参数向量。
2.根据权利要求1所述的方法,其特征在于,统计目标参数向量之间的距离分布,包括:
统计目标参数向量之间的距离的第一分布;
根据不同阈值分别对目标参数向量做聚类;
分别统计根据不同阈值做聚类后的目标参数向量之间的距离的第二分布。
3.根据权利要求2所述的方法,其特征在于,根据所述距离分布确定所述目标参数向量做聚类的目标阈值,包括:
分别计算不同阈值下所述第一分布和所述第二分布的相对熵,获得相对熵随阈值变化曲线;
根据所述相对熵阈值变化曲线确定所述目标阈值。
4.根据权利要求3所述的方法,其特征在于,根据所述相对熵阈值变化曲线确定所述目标阈值,包括:
获得所述相对熵阈值变化曲线的一阶导数曲线;
获取所述一阶导数曲线的平滑阶段;
选取所述平滑阶段对应的阈值作为所述目标阈值。
5.根据权利要求1所述的方法,其特征在于,根据所述目标阈值和目标参数向量之间的距离,估计所述目标模型的参数向量的表示空间大小,包括:
统计目标参数向量之间的距离小于所述目标阈值的比例;
根据所述比例估计所述表示空间大小。
6.根据权利要求5所述的方法,其特征在于,根据以下公式估计所述表示空间大小K:
上述公式中,p为所述比例。
7.根据权利要求1所述的方法,其特征在于,所述目标模型包括嵌入层和深度神经网络;所述方法还包括:
获取所述嵌入层的长度;
根据所述嵌入层的长度和所述表示空间大小确定所述嵌入层的参数向量的量化比特数。
8.一种推荐方法,其特征在于,包括:
获取目标客户端的当前用户特征和当前信息特征;
通过基于深度学习的目标模型对所述当前用户特征和所述当前信息特征进行处理,获得推荐信息以发送至所述目标客户端;
其中,所述目标模型的参数向量根据估计的表示空间大小进行量化压缩,利用如权利要求1至7任一项所述的方法估计所述目标模型的参数向量的表示空间大小。
9.一种模型参数表示空间大小估计装置,其特征在于,包括:
目标参数获取模块,配置为获取目标模型的目标参数向量;
距离分布统计模块,配置为统计目标参数向量之间的距离分布;
目标阈值确定模块,配置为根据所述距离分布确定所述目标参数向量做聚类的目标阈值;
空间大小估计模块,配置为根据所述目标阈值和目标参数向量之间的距离,估计所述目标模型的参数向量的表示空间大小;
其中,所述目标参数获取模块包括:
模型训练单元,配置为在多台服务器上并行训练所述目标模型,以使所述目标模型达到稳定状态;
参数存储单元,配置为在每台服务器上保存所述目标模型的部分模型参数;
参数采样单元,配置为采样所述多台服务器中的全部服务器上的模型参数或部分服务器上的部分模型参数作为所述目标参数向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910325428.6/1.html,转载请声明来源钻瓜专利网。