[发明专利]一种声音直播用户的年龄预测方法有效

申请号：	201911106871.0	申请日：	2019-11-13
公开（公告）号：	CN111031362B	公开（公告）日：	2022-01-25
发明（设计）人：	廉亚红;丁宁	申请（专利权）人：	广州荔支网络技术有限公司
主分类号：	H04N21/258	分类号：	H04N21/258;H04N21/25;H04N21/45;H04N21/442;H04N21/466
代理公司：	中山奇昱专利代理事务所(普通合伙) 44557	代理人：	黄国清
地址：	510000 广东省广州市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种声音直播用户年龄预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种声音直播用户的年龄预测方法，其特征在于：包括如下步骤：

根据已知年龄声音直播用户的信息构建画像系统；

根据未知年龄声音直播用户的信息构建画像系统；

根据已知年龄声音直播用户的画像系统和未知年龄声音直播用户的画像系统，训练用户年龄生成模型，生成未知年龄声音直播用户的年龄，

其中，构建已知年龄声音直播用户与未知年龄声音直播用户画像系统包括：

通过系统信息完成相关信息的自动化收集，其中所述相关信息包括用户波段号、用户id、用户设备id、用户昵称、用户职业、用户常住地、用户最近一次收听直播时间、用户首次收听直播的时间、用户的年龄段偏好，所述相关信息还包括声音直播用户的app安装列表；

通过数据挖掘和数据统计构建补充信息，其中所述用户的补充信息包括用户的有效收听节目率、用户的完播率、用户的付费率、用户的关注主播数、用户的收听声音直播的一级标签偏好、用户的收听声音直播的二级标签偏好、用户的收听声音直播的主播性别偏好、用户打开app的时间分布；

基于相关信息和补充信息，进行合并与聚类，通过对相关信息和补充信息进行合并和聚类，得出声音直播用户的历史行为信息、声音直播用户对主播的偏好信息、声音直播用户的活跃度信息、声音直播用户各个app分类下的app安装个数，以构建声音直播用户画像系统；

对相关信息和补充信息进行合并和聚类后得出的信息进行处理，得出回归特征，回归特征包括：

根据声音直播用户的历史行为信息生成行为特征；

根据声音直播用户对主播的偏好信息进行tfidf以及svd降维；

根据声音直播用户的活跃度信息生成用户活跃序列数据embedding；

根据声音直播用户的app安装列表通过knn补充缺失的app的类别信息，进行tfidf以及svd降维。

2.根据权利要求1所述的一种声音直播用户的年龄预测方法，其特征在于：对已知年龄声音直播用户获取的相关信息还包括用户年龄。

3.根据权利要求1所述的一种声音直播用户的年龄预测方法，其特征在于：按照如下步骤进行训练模型：步骤一：从声音直播app中抽取若干名实名认证的用户作为训练数据；步骤二：根据用户在声音直播中的行为生成用户年龄特征向量；步骤三：模型预测；步骤四：模型优化。

4.根据权利要求1所述的一种声音直播用户的年龄预测方法，其特征在于：对回归特征分别使用lightGBM和mlp训练年龄预测模型，然后进行stacking。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州荔支网络技术有限公司，未经广州荔支网络技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911106871.0/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载