[发明专利]机器学习模型中特征值的确定方法、装置及电子设备有效
申请号: | 201911349227.6 | 申请日: | 2019-12-24 |
公开(公告)号: | CN111163072B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 李文学;史忠伟 | 申请(专利权)人: | 五八有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;G06N20/00;G06F21/55 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 300450 天津市滨海新区经济技术开*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 模型 特征值 确定 方法 装置 电子设备 | ||
1.一种机器学习模型中特征值的确定方法,其特征在于,所述方法包括:
获取用户当前时刻访问服务器产生的在线行为数据,所述在线行为数据包括当前时间戳信息和目标特征字段;
从离线行为数据集合中选取包含所述目标特征字段的样本数据集合,所述样本数据集合包括多条样本数据;
根据每条样本数据对应的时间戳信息,将所述样本数据按照时间先后顺序进行排序;
根据所述当前时间戳信息以及排序后的样本数据,确定符合所述预设取值时间段的目标样本数据集合;
根据所述在线行为数据以及所述目标样本数据集合,确定机器学习模型的特征值。
2.根据权利要求1所述的方法,其特征在于,从离线行为数据集合中选取包含所述目标特征字段的样本数据集合,包括:
根据所述离线行为数据集合中每条离线行为数据对应的用户信息,确定与当前时刻进行访问的用户相匹配的初始样本数据集合;
从所述初始样本数据集合中选取包含所述目标特征字段的样本数据集合。
3.根据权利要求1所述的方法,其特征在于,所述目标样本数据集合包括多条目标样本数据;
根据所述在线行为数据以及所述目标样本数据集合,确定机器学习模型的特征值,包括:
根据每条目标样本数据中所述目标特征字段的属性值以及所述在线行为数据中目标特征字段的属性值,确定机器学习模型的特征值。
4.根据权利要求1所述的方法,其特征在于,确定机器学习模型的特征值之后,所述方法还包括:
根据所述特征值,训练机器学习模型。
5.一种机器学习模型中特征值的确定装置,其特征在于,所述装置包括:
获取单元,用于获取用户当前时刻访问服务器产生的在线行为数据,所述在线行为数据包括当前时间戳信息和目标特征字段;以及,从离线行为数据集合中选取包含所述目标特征字段的样本数据集合,所述样本数据集合包括多条样本数据;
处理单元,用于根据每条样本数据对应的时间戳信息,将所述样本数据按照时间先后顺序进行排序;并根据所述当前时间戳信息以及排序后的样本数据,确定符合所述预设取值时间段的目标样本数据集合;以及,根据所述在线行为数据以及所述目标样本数据集合,确定机器学习模型的特征值。
6.根据权利要求5所述的装置,其特征在于,所述获取单元具体用于:
根据所述离线行为数据集合中每条离线行为数据对应的用户信息,确定与当前时刻进行访问的用户相匹配的初始样本数据集合;以及,从所述初始样本数据集合中选取包含所述目标特征字段的样本数据集合。
7.根据权利要求5所述的装置,其特征在于,所述目标样本数据集合包括多条目标样本数据;
所述处理单元具体用于:
根据每条目标样本数据中所述目标特征字段的属性值以及所述在线行为数据中目标特征字段的属性值,确定机器学习模型的特征值。
8.根据权利要求5所述的装置,其特征在于,所述处理单元还用于:
根据所述特征值,训练机器学习模型。
9.一种电子设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用并执行所述存储器中的程序指令,以实现权利要求1至4中任一项所述的特征值的确定方法。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,当特征值的确定装置的至少一个处理器执行所述计算机程序时,特征值的确定装置执行权利要求1至4中任一项所述的特征值的确定方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五八有限公司,未经五八有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911349227.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度学习的安全帽佩戴检测方法及装置
- 下一篇:地面站资源调度方法