[发明专利]基于商业兴趣的目标人群确定及信息推送方法和系统在审
申请号: | 201811491017.6 | 申请日: | 2018-12-06 |
公开(公告)号: | CN109597940A | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 谢常亮;吴安新;吴超;唐亚光;黄声声 | 申请(专利权)人: | 上海哔哩哔哩科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35 |
代理公司: | 上海大视知识产权代理事务所(特殊普通合伙) 31314 | 代理人: | 顾小伟;蔡沅 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标人群 商业兴趣 分类标签 信息推送 服务器 计算机程序 存储器 信息接收终端 处理器执行 互联网技术 自定义特征 关键词组 机器学习 推送信息 训练数据 相关度 处理器 推送 标注 存储 自动化 终端 分类 | ||
1.一种基于商业兴趣的目标人群确定方法,其特征在于,所述的方法包括以下步骤:
(1)对已有的商业兴趣分类标签进一步分类标注,得到创意分类标签;
(2)根据所述的创意分类标签,获取训练数据并进行机器学习,得到基于所述的商业兴趣分类标签的相关度分值;
(3)根据所述的相关度分值,确定具有信息推送价值的目标人群。
2.根据权利要求1所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(1)具体为:根据已有的商业兴趣分类标签的结构类型,按照相应的创意分类内容进行结构延伸和类目划分,得到创意分类标签。
3.根据权利要求2所述基于商业兴趣的目标人群确定方法,其特征在于,所述商业兴趣分类标签为二级结构,所述创意分类标签为三级结构,所述创意分类标签的上二级结构与商业兴趣分类标签一致。
4.根据权利要求1所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(2)具体包括以下步骤:
(21)根据所述的创意分类标签,获取历史用户的操作日志;
(22)根据所述的操作日志,得到训练数据;
(23)根据所述的训练数据进行机器学习,得到基于所述的创意分类标签对应的商业兴趣分类标签的相关度分值。
5.根据权利要求4所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(22)具体包括以下步骤:
(221)根据所述的操作日志,通过样本划分得到用于机器学习的样本数据;
(222)根据所述的操作日志,提取分类特征,构造特征字典;
(223)将所述的样本数据与所述的分类特征进行关联,得到所述的训练数据。
6.根据权利要求5所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(221)具体为:遍历所述的操作日志,将其中被点击的广告日志确定为正样本,曝光未点击的广告日志确定为负样本,得到用于机器学习的样本数据。
7.根据权利要求6所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(221)还包括:将所述的操作日志中的异常数据进行清洗过滤。
8.根据权利要求5所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(222)具体为:根据所述的操作日志中的具体行为提取用户对应的分类特征,并对所述的分类特征进行编号,得到所述的特征字典。
9.根据权利要求8所述基于商业兴趣的目标人群确定方法,其特征在于,所述具体行为包括:搜索、播放、分享、收藏和投币。
10.根据权利要求4所述基于商业兴趣的目标人群确定方法,其特征在于,所述步骤(23)具体包括以下步骤:
(231)判断所述的操作日志数量是否达到训练阈值,若是则进入步骤(232),若否则返回步骤(21);
(232)根据机器学习的需求,划分训练数据,得到训练集、测试集和验证集,并选择训练算法进行机器学习;
(233)将机器学习得到的分数结果通过归一化划分到0至1之间,得到基于所述的创意分类标签对应的商业兴趣分类标签的相关度分值。
11.根据权利要求10所述基于商业兴趣的目标人群确定方法,其特征在于,所述划分训练数据具体为:根据5折交叉验证的方式对训练数据进行划分。
12.根据权利要求10所述基于商业兴趣的目标人群确定方法,其特征在于,所述训练算法具体为XGBoost算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海哔哩哔哩科技有限公司,未经上海哔哩哔哩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811491017.6/1.html,转载请声明来源钻瓜专利网。