[发明专利]一种基于应用程序预测用户文化水平的方法和系统在审
申请号: | 201910536175.7 | 申请日: | 2019-06-20 |
公开(公告)号: | CN110309307A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 蒋健宏;严锐;胡宏辉 | 申请(专利权)人: | 上海上湖信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 顾友 |
地址: | 200000 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用程序 特征矩阵 文化水平 预测 分类模型 时间段 构建 分类处理 决策支持 信息推荐 准确率 预设 分类 统计 服务 | ||
1.一种基于应用程序预测用户文化水平的方法,其特征在于,所述方法包括:
获取用户安装的应用程序并进行分类处理;
根据所述分类后的应用程序构建特征矩阵;其中,所述特征矩阵的行代表按照时间段统计得到的不同类别的应用程序的个数,列代表时间段;
将所述特征矩阵输入至预设的分类模型中,预测得到用户的学历类别。
2.根据权利要求1所述的方法,其特征在于,所述分类模型为随机森林分类模型,将所述特征矩阵输入至预设的分类模型中,预测得到用户的学历类别具体包括:
将所述特征矩阵输入至随机森林的每颗决策树,得到关于所述应用程序的分类结果;
汇总每颗决策树的分类结果,进行分类投票,预测得到所述应用程序的最终分类,从而得到该用户的学历类别。
3.根据权利要求1所述的方法,其特征在于,所述分类模型的构建过程包括:
获取用户安装的应用程序作为输入信息、获取用户的学历类别作为输出信息,确定所述输入信息与输出信息之间的映射关系,从而构建所述分类模型。
4.根据权利要求1~3任意一项所述的方法,其特征在于,所述方法还包括:
对所述特征矩阵进行数据处理,将其转化成高维稀疏矩阵。
5.根据权利要求1~3任意一项所述的方法,其特征在于,所述获取用户安装的应用程序并进行分类处理具体包括:
获取用户安装的应用程序的名称及安装时间,对应用程序进行分类。
6.一种基于应用程序预测用户文化水平的系统,其特征在于,所述系统包括:
数据处理模块:用于获取用户安装的应用程序并进行分类处理;
特征构建模块:用于根据所述分类后的应用程序构建特征矩阵;其中,所述特征矩阵的行代表按照时间段统计得到的不同类别的应用程序的个数,列代表时间段;
预测模块:用于将所述特征矩阵输入至预设的分类模型中,预测得到用户的学历类别。
7.根据权利要求6所述的系统,其特征在于,所述分类模型为随机森林分类模型,所述预测模块具体包括:
分类模块:用于将所述特征矩阵输入至随机森林的每颗决策树,得到关于所述应用程序的分类结果;
投票模块:用于汇总每颗决策树的分类结果,进行分类投票,预测得到所述应用程序的最终分类,从而得到该用户的学历类别。
8.根据权利要求6所述的系统,其特征在于,所述系统还包括分类模型构建模块,所述分类模型构建模块用于获取用户安装的应用程序作为输入信息、获取用户的学历类别作为输出信息,确定所述输入信息与输出信息之间的映射关系,从而构建所述分类模型。
9.根据权利要求6~8任意一项所述的系统,其特征在于,所述系统还包括:
特征转化模块:对所述特征矩阵进行数据处理,将其转化成高维稀疏矩阵。
10.根据权利要求6~8任意一项所述的系统,其特征在于,所述数据处理模块具体用于:
获取用户安装的应用程序的名称及安装时间,对应用程序进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海上湖信息技术有限公司,未经上海上湖信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910536175.7/1.html,转载请声明来源钻瓜专利网。