[发明专利]基于智能手机姿态行为大数据的用户性别识别方法在审
申请号: | 201710192894.2 | 申请日: | 2017-03-28 |
公开(公告)号: | CN107015647A | 公开(公告)日: | 2017-08-04 |
发明(设计)人: | 罗海飙 | 申请(专利权)人: | 广州中国科学院软件应用技术研究所 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06K9/62;H04M1/725 |
代理公司: | 广州番禺容大专利代理事务所(普通合伙)44326 | 代理人: | 刘新年 |
地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 智能手机 姿态 行为 数据 用户 性别 识别 方法 | ||
技术领域
本发明涉及大数据技术领域,具体涉及一种基于智能手机姿态行为大数据的用户性别识别方法。
背景技术
随着移动互联网的高速发展,智能手机的用户画像或者说是用户标签对于在庞大的移动互联网用户群体中对精准人群进行品牌营销尤为关键。用户画像是将用户信息标签化,即企业通过收集与分析用户的消费习惯、生活习惯和社会属性等主要信息的数据后,抽象出用户的商业全貌。移动互联网企业可以通过用户画像寻找匹配人群,精准推送营销广告或服务信息,最终实现个性化营销与服务推送。
经过20多年的发展,随着技术的进步,手机无论从造型还是功能都发生了翻天覆地的变化,已经不再是一个简单的通信工具,而是具有多样化的功能。在这种情况下,各种传感器在IPhone、IPad、Android系统和其它系统的智能手机中得到广泛应用。其中,加速度/运动传感器、陀螺仪可通过感知设备的加速度/重力和运动状态,从而得到当前设备的姿态。
针对用户的画像研判,当前已经有了一些研究工作,主要集中在用户的网络日志和搜索内容上。对网络日志的书写习惯和用语习惯、以及用户的搜索内容,通过基于文本的分类方法、统计分析和关联预测方法,建立搜索内容、用语习惯等与用户基本属性之间的联系,从而预测用户的性别、年龄、职业等用户画像属性。
但是,对于智能手机,其浏览器一般没有Cookie,用户的网络日志难以获取。用户的搜索一般只能由搜索引擎公司获得,第三方公司无法得到。因此,在手机上要获取用户信息,建立用户画像是比较困难的。因此一些新的方法被提出。例如专利《一种基于智能手机加速度传感器的用户基础属性预测方法》提出通过收集用户智能手机的流量数据,例如APP流量的精确使用情况,包括APP的名字、使用时间和流量等特征数据,再通过SVM模型对这些数据进行分析,建立用户分类预测模型。但是该方法的准确性不是很高。
发明内容
针对上述问题,本发明的目的在于提供一种基于智能手机姿态行为大数据的用户性别识别方法,实现通过用户使用智能手机的姿态行为的不同精确识别智能手机用户性别的方法。
本发明通过以下技术手段解决上述问题:
一种基于智能手机姿态行为大数据的用户性别识别方法,包括如下步骤:
S1、使用智能手机操作系统提供的API,记录智能手机一段时间内加速传感器、陀螺传感器和方向传感器返回的数据;
S2、通过加速传感器和陀螺传感器返回的数据采用算法得到智能手机用户的运动状态,对运动状态进行分类,记录每个运动状态下的加速传感器、陀螺传感器和方向传感器的数据;
S3、对加速传感器的数据进行处理,得到每个运动状态下的加速特征值组;
S4、将每个运动状态下的加速特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的加速特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;
S5、对陀螺传感器的数据进行处理,得到每个运动状态下的角速度特征值组;
S6、将每个运动状态下的角速度特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的角速度特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;
S7、对方向传感器的数据进行处理,得到每个运动状态下的方向特征值组;
S8、将每个运动状态下的方向特征值组放到大数据分类算法模型中,首先使用已知性别的每个运动状态下的方向特征值组作为样本数据输入到大数据分类算法模型中进行训练,再用训练好的数据预测用户的性别;
S9、将步骤S4、步骤S6和步骤S8结果加权平均得到最终的用户的性别。
进一步地,步骤S3-S4、步骤S5-S6和步骤S7-S8是同时进行的。
进一步地,所述运动状态包括走路、跑步、上楼、下楼、乘坐交通工具、坐和静止。
进一步地,步骤S2中,采用Android官方API文档和IPhone官方API文档中叙述的算法得到智能手机用户的运动状态。
进一步地,步骤S7具体包括如下步骤:
S71、方向传感器数据记录三个维度数据:智能手机绕着Z轴旋转的角度、智能手机绕着X轴旋转的角度和智能手机绕着Y轴旋转的角度;
S72、对每个运动状态下的方向传感器数据按时间顺序进行统计,将突然上升或突然下降超过一定阀值的数据记录为一个峰值;
S73、对相邻两个峰值之间的数据计算数据的平均值、最大值、最小值和标准差;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州中国科学院软件应用技术研究所,未经广州中国科学院软件应用技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710192894.2/2.html,转载请声明来源钻瓜专利网。