[发明专利]一种基于逻辑回归的用户性别预测方法有效
申请号: | 201910901326.4 | 申请日: | 2019-09-23 |
公开(公告)号: | CN112541010B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 彭文元 | 申请(专利权)人: | 银橙(上海)信息技术有限公司 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457 |
代理公司: | 上海愉腾专利代理事务所(普通合伙) 31306 | 代理人: | 唐海波 |
地址: | 201414 上海市奉贤*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 逻辑 回归 用户 性别 预测 方法 | ||
本发明涉及通信技术领域,尤其涉及一种基于逻辑回归的用户性别预测方法,包括:获取用户数据;对获取的用户数据进行预处理以获得用户数据样本集和待预测用户数据集;根据用户数据样本集构建逻辑回归性别预测算法模型;通过逻辑回归性别预测算法模型对待预测用户数据集进行性别预测并输出性别预测结果。本发明通过对构建算法模型,并对其进行假设函数算法、代价函数算法以及梯度下降算法的处理,从而精准预测用户的性别,扩充用户标签数据库,以为更多的用户标注性别标签,从而提高了广告精准投放的效果。
技术领域
本发明涉及通信技术领域,尤其涉及一种基于逻辑回归的用户性别预测方法。
背景技术
随着娱乐文化的发展,在线点击率成了衡量其是否受欢迎的基石。为了便于了解受众的行为,根据用户的年龄、性别、低于、用户偏好、设备信息等特征来为用户设立标签,以勾勒用户的立体画像,从而便于在线广告或视频的精准投放。由于性别是用户最基础的静态属性之一,是人类自然体上最大基因差异特征,对用户的言行举止、思想决策有莫大的影响,因此性别分析显得尤为重要。
发明内容
鉴于上述无法预测用户性别以至不能准确投放广告的问题,本发明提供了一种基于逻辑回归的用户性别预测方法,能够准确预测用户性别属性,构建精准的用户画像,从而便于快速、精准的投放广告或视频。
为达到上述目的,本发明的实施例采用如下技术方案:
本发明提供了一种基于逻辑回归的用户性别预测方法,基于逻辑回归的用户性别预测方法包括:获取用户数据;对获取的用户数据进行预处理以获得用户数据样本集和待预测用户数据集;根据用户数据样本集构建逻辑回归性别预测算法模型;通过逻辑回归性别预测算法模型对待预测用户数据集进行性别预测并输出性别预测结果。
依照本发明的一个方面,对获取的用户数据进行预处理以获得用户数据样本集和待预测用户数据集的具体步骤包括:获取用户数据,并对其进行筛选,将其中含有性别标签的用户数据汇总形成待处理样本,将其中不含有性别标签的用户数据汇总形成待预测用户数据集;对待处理样本进行清洗;将清洗后的待处理样本进行特征处理以形成用户数据样本集。
依照本发明的一个方面,将待处理样本进行清洗的具体步骤包括:统计待处理样本的数据缺失率;对待处理样本进行判断处理。
依照本发明的一个方面,判断处理具体包括:判断待处理样本是否特征缺失,若是,则剔除;判断待处理样本的用户ID是否相同,若相同,判断其性别标签是否一致,若不一致,则删除其性别标签,并将其作为无性别标签的样本;判断待处理样本是否为作弊的流量,若为作弊流量,则剔除。
依照本发明的一个方面,将清洗后的待处理样本进行特征处理的具体步骤包括:选取特定特征维度;按特征名和特征值的方式对经清洗后的待处理样本构建特征字符串;将特征字符串哈希并将哈希后的数值取余,从而得到经清洗后的待处理样本在特定特征维度中的位置。
依照本发明的一个方面,根据用户数据样本集构建逻辑回归性别预测算法模型的具体步骤包括:对用户数据样本集进行划分处理,形成训练样本集和测试样本集;构建逻辑回归性别预测算法初始模型;向逻辑回归性别预测算法初始模型内输入训练样本集,以进行模型训练;向经模型训练后的逻辑回归性别预测算法初始模型内输入测试样本集,并判断是否将该逻辑回归性别预测算法初始模型作为逻辑回归性别预测算模型以对待预测用户数据集进行性别预测。
依照本发明的一个方面,构建逻辑回归性别预测算法初始模型的具体步骤包括:设立假设函数,并设置判断规则;根据假设函数设立代价函数;对代价函数求偏导以得到梯度并构建梯度下降函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银橙(上海)信息技术有限公司,未经银橙(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910901326.4/2.html,转载请声明来源钻瓜专利网。