[发明专利]模型训练方法、装置及计算机设备有效
申请号: | 202011462635.5 | 申请日: | 2020-12-11 |
公开(公告)号: | CN112613938B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 张杨;刘方奇 | 申请(专利权)人: | 上海哔哩哔哩科技有限公司 |
主分类号: | G06Q30/0601 | 分类号: | G06Q30/0601;G06F16/9535;G06F18/214;G06N3/04 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 邓小玲;王勇 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 计算机 设备 | ||
1.一种模型训练方法,其特征在于,所述方法包括:
获取目标用户集的用户信息数据,识别出对应的用户基础特征数据集;
获取所述目标用户集的用户实时产生的用户行为数据,将所述用户行为数据存储到目标存储单元,所述目标存储单元为SSD磁盘;
在每一条用户行为数据存入到所述目标存储单元时统计出所述每一条用户行为数据的用户兴趣标签;
对所述目标存储单元中的用户兴趣标签进行分组以得到目标时间区段内的用户兴趣标签集;
将所述用户兴趣标签集从所述目标存储单元取出,与所述用户基础特征数据集聚合,生成所述目标时间区段的用户实时特征数据集;
将所述用户实时特征数据集输入到预设的模型进行模型训练。
2.如权利要求1所述的模型训练方法,其特征在于,通过RocksDB数据库引擎技术实现所述将所述用户行为数据存储到目标存储单元的步骤和所述将所述用户兴趣标签集从所述目标存储单元取出的步骤。
3.如权利要求1所述的模型训练方法,其特征在于,所述对所述目标存储单元中的用户兴趣标签进行分组包括:
识别出每一条用户兴趣标签对应的用户行为数据的产生时间;
对所述目标存储单元中产生时间处于所述目标时间区段用户兴趣标签分组为所述用户兴趣标签集。
4.如权利要求1所述的模型训练方法,其特征在于,所述对所述目标存储单元中的用户兴趣标签进行分组包括:
获取用户输入的或预先设置的拉取周期;
根据所述拉取周期,周期性执行所述对所述目标存储单元中的用户兴趣标签进行分组的步骤。
5.如权利要求1所述的模型训练方法,其特征在于,所述方法还包括:
监测所述目标存储单元中的用户行为数据的最小产生时间和当前时间的时间差;
当所述时间差大于预设的时间阈值时,将产生时间最小的用户行为数据清除。
6.如权利要求1~5中任一项所述的模型训练方法,其特征在于,
所述用户基础特征数据集包括:用户性别、年龄、职业或在网年龄中的至少一项用户基础特征数据;
所述用户兴趣标签集包括:教育资源偏好标签、鬼畜视频偏好标签、动漫视频偏好标签或二次元视频偏好标签的至少一项用户兴趣标签。
7.一种模型训练装置,其特征在于,所述装置包括:
获取模块,用于获取目标用户集的用户信息数据,识别出对应的用户基础特征数据集;以及获取所述目标用户集的用户实时产生的用户行为数据;
存取模块,用于将所述用户行为数据存储到目标存储单元,所述目标存储单元为SSD磁盘;
识别模块,用于在每一条用户行为数据存入到所述目标存储单元时统计出所述每一条用户行为数据的用户兴趣标签;
分组模块,用于对所述目标存储单元中的用户兴趣标签进行分组以得到目标时间区段内的用户兴趣标签集;
所述存取模块,还用于将所述用户兴趣标签集从所述目标存储单元取出;
聚合模块,用于将所述用户兴趣标签集与所述用户基础特征数据集聚合,生成所述目标时间区段的用户实时特征数据集;
训练模块,用于将所述用户实时特征数据集输入到预设的模型进行模型训练。
8.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1~6任一项所述的模型训练方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序可被至少一个处理器执行,以使所述至少一个处理器执行如权利要求1~6中任一项所述的模型训练方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海哔哩哔哩科技有限公司,未经上海哔哩哔哩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011462635.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电路板生产用防差错检测设备
- 下一篇:一种梯度式分层烘干通道