[发明专利]一种基于应用程序预测用户文化水平的方法和系统在审
申请号: | 201910536175.7 | 申请日: | 2019-06-20 |
公开(公告)号: | CN110309307A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 蒋健宏;严锐;胡宏辉 | 申请(专利权)人: | 上海上湖信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 顾友 |
地址: | 200000 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用程序 特征矩阵 文化水平 预测 分类模型 时间段 构建 分类处理 决策支持 信息推荐 准确率 预设 分类 统计 服务 | ||
本发明公开一种基于应用程序预测用户文化水平的方法和系统,方法包括:获取用户安装的应用程序并进行分类处理;根据分类后的应用程序构建特征矩阵;其中,特征矩阵的行代表按照时间段统计得到的不同类别的应用程序的个数,列代表时间段;将特征矩阵输入至预设的分类模型中,预测得到用户的学历类别。本发明通过提取用户安装的应用程序的名称、安装时间等信息,构建特征矩阵输入至分类模型中,从而完成用户的文化水平预测,该方案简单易行,并且准确率高,通过获取应用程序的来预测用户的文化水平,为后期对用户进行信息推荐、服务指定等提供决策支持。
技术领域
本发明属于计算机领域,尤其涉及一种基于应用程序预测用户文化水平的方法和系统。
背景技术
学历信息对于很多方面的业务的决策都非常的重要,随着学信网对外输出学历查询的服务越来越严,这块的信息越来越难获取到。然而,随着智能移动设备日渐融入人们的日常生活,人们越来越依赖手机,人们根据自己的兴趣爱好或者生活需要在手机上安装各种应用,不同的人群安装的应用是有区别的,手机成为反映一个人特征的信息载体。因此,可以通过手机来间接获取用户的学历信息,从而为各方面的业务提供参考。
发明内容
为了解决现有技术的问题,本发明通过提取用户安装的应用程序的名称、安装时间等信息,构建特征矩阵输入至分类模型中,从而完成用户的文化水平预测,该方案简单易行,并且准确率高,通过获取应用程序的来预测用户的文化水平,为后期对用户进行信息推荐、服务指定等提供决策支持。
本发明实施例提供的具体技术方案如下:
第一方面,本发明提供一种基于应用程序预测用户文化水平的方法,所述方法包括:
获取用户安装的应用程序并进行分类处理;
根据所述分类后的应用程序构建特征矩阵;其中,所述特征矩阵的行代表按照时间段统计得到的不同类别的应用程序的个数,列代表时间段;
将所述特征矩阵输入至预设的分类模型中,预测得到用户的学历类别。
在一些实施例中,所述分类模型为随机森林分类模型,将所述特征矩阵输入至预设的分类模型中,预测得到用户的学历类别具体包括:
将所述特征矩阵输入至随机森林的每颗决策树,得到关于所述应用程序的分类结果;
汇总每颗决策树的分类结果,进行分类投票,预测得到所述应用程序的最终分类,从而得到该用户的学历类别。
在一些实施例中,所述分类模型的构建过程包括:
获取用户安装的应用程序作为输入信息、获取用户的学历类别作为输出信息,确定所述输入信息与输出信息之间的映射关系,从而构建所述分类模型。
在一些实施例中,所述方法还包括:
对所述特征矩阵进行数据处理,将其转化成高维稀疏矩阵。
在一些实施例中,所述获取用户安装的应用程序并进行分类处理具体包括:
获取用户安装的应用程序的名称及安装时间,对应用程序进行分类。
第二方面,本发明提供了一种基于应用程序预测用户文化水平的系统,所述系统包括:
数据处理模块:用于获取用户安装的应用程序并进行分类处理;
特征构建模块:用于根据所述分类后的应用程序构建特征矩阵;其中,所述特征矩阵的行代表按照时间段统计得到的不同类别的应用程序的个数,列代表时间段;
预测模块:用于将所述特征矩阵输入至预设的分类模型中,预测得到用户的学历类别。
在一些实施例中,所述分类模型为随机森林分类模型,所述预测模块具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海上湖信息技术有限公司,未经上海上湖信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910536175.7/2.html,转载请声明来源钻瓜专利网。