[发明专利]小众app分类系统在审

专利信息
申请号: 202110734914.0 申请日: 2021-06-30
公开(公告)号: CN115618279A 公开(公告)日: 2023-01-17
发明(设计)人: 俞锋锋;吕繁荣;尹祖勇;李正;曾昱深 申请(专利权)人: 杭州云深科技有限公司
主分类号: G06F18/2411 分类号: G06F18/2411;G06F18/214
代理公司: 北京锺维联合知识产权代理有限公司 11579 代理人: 丁慧玲
地址: 310030 浙江省杭州*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 小众 app 分类 系统
【说明书】:

发明涉及一种小众app分类系统,实现步骤S1、基于app分类模型中,生成M类小众app;步骤S2、基于目标向量生成模型,生成每一小众app的目标向量;步骤S3、将类内距离和类间距离小于预设预设比值的小众app类别中的所有小众app的类别标签变更为第(M+1)类别;步骤S4、将类内距离和类间距离大于等于预设预设比值的小众app类别确定为待处理类别,设定初始半径,对于每一所述待处理类别,以预设的半径递增步长调整半径,在每一半径下的小众app密度和小众app召回率,基于所述待处理类别在不同半径下的app密度分布和app召回率分布从所述待处理类别确定实际属于该类别的小众app,将未被确定的小众app的标签变更为第(M+1)类别。本发明提高了小众app的分类准确性。

技术领域

本发明涉及计算机技术领域,尤其涉及一种小众app分类系统。

背景技术

随着科技的迅速发展,app的数量也迅猛增长,很多应用场景下需要基于一个或多个类别的app进行分析,这便需要对海量app进行准确的分类。现有的app分类多是直接基于app的名称、包名等app特征信息训练得到分类模型进行app分类,app根据安装量的量级可以划分为小众app和大众app,小众app在全部app中占据很大,种类较多,小众app总数据量非常大,而每一小众app的样本数量又较少,因此采用现有的app分类方法对海量的小众app进行分类,分类准确性低。由此可知,如何提高小众app的分类准确性成为亟待解决的技术问题。

发明内容

本发明目的在于,提供一种小众app分类系统,提高了小众app的分类准确性。

根据本发明第一方面,提供了一种小众app分类系统,包括预先构建的第一数据库和第二数据库,预先训练的app分类模型和app目标向量生成模型存储有计算机程序的存储器和处理器,所述第一数据库存储有小众app特征信息记录,所述小众app特征信息记录包括小众app id和对应的多个app特征信息;所述第二数据库存储有小众app序列表和小众app初始向量映射表,所述小众app序列表包括小众app安装序列表、小众app卸载序列表以及小众app活跃序列表中的一种或多种;所述app分类模型基于第一样本小众app在所述第一数据库对应的特征信息训练得到;所述app目标向量生成模型基于所述第二数据库中的样本用户id对应的小众app序列记录和小众app初始向量映射表训练得到,所述小众app为安装量小于预设安装量的app;

当所述处理器在执行所述计算机程序时,实现以下步骤:

步骤S1、基于所述第一数据库中的每一小众app特征信息记录生成输入特征向量,并输入到所述app分类模型中,得到每一小众app的类别标签,从而生成M类小众app;

步骤S2、将每一所述小众app初始向量输入所述app目标向量生成模型,生成每一小众app对应的目标向量;

步骤S3、获取每一类小众app对应的中心向量,基于每一类小众app对应的中心向量和每一类小众app中所有小众app的目标向量得到每一类小众app对应的类内距离和类间距离,将类内距离和类间距离小于预设预设比值的小众app类别中的所有小众app的类别标签变更为第(M+1)类别;

步骤S4、将类内距离和类间距离大于等于预设预设比值的小众app类别确定为待处理类别,设定初始半径,对于每一所述待处理类别,以预设的半径递增步长调整半径,获取所述待处理类别在每一半径下的小众app密度和小众app召回率,基于所述待处理类别在不同半径下的app密度分布和app召回率分布从所述待处理类别确定实际属于该类别的小众app,将未被确定的小众app的标签变更为第(M+1)类别。

本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种小众app分类系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云深科技有限公司,未经杭州云深科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110734914.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top