[发明专利]小众app分类系统在审
申请号: | 202110734914.0 | 申请日: | 2021-06-30 |
公开(公告)号: | CN115618279A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 俞锋锋;吕繁荣;尹祖勇;李正;曾昱深 | 申请(专利权)人: | 杭州云深科技有限公司 |
主分类号: | G06F18/2411 | 分类号: | G06F18/2411;G06F18/214 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 丁慧玲 |
地址: | 310030 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 小众 app 分类 系统 | ||
本发明涉及一种小众app分类系统,实现步骤S1、基于app分类模型中,生成M类小众app;步骤S2、基于目标向量生成模型,生成每一小众app的目标向量;步骤S3、将类内距离和类间距离小于预设预设比值的小众app类别中的所有小众app的类别标签变更为第(M+1)类别;步骤S4、将类内距离和类间距离大于等于预设预设比值的小众app类别确定为待处理类别,设定初始半径,对于每一所述待处理类别,以预设的半径递增步长调整半径,在每一半径下的小众app密度和小众app召回率,基于所述待处理类别在不同半径下的app密度分布和app召回率分布从所述待处理类别确定实际属于该类别的小众app,将未被确定的小众app的标签变更为第(M+1)类别。本发明提高了小众app的分类准确性。
技术领域
本发明涉及计算机技术领域,尤其涉及一种小众app分类系统。
背景技术
随着科技的迅速发展,app的数量也迅猛增长,很多应用场景下需要基于一个或多个类别的app进行分析,这便需要对海量app进行准确的分类。现有的app分类多是直接基于app的名称、包名等app特征信息训练得到分类模型进行app分类,app根据安装量的量级可以划分为小众app和大众app,小众app在全部app中占据很大,种类较多,小众app总数据量非常大,而每一小众app的样本数量又较少,因此采用现有的app分类方法对海量的小众app进行分类,分类准确性低。由此可知,如何提高小众app的分类准确性成为亟待解决的技术问题。
发明内容
本发明目的在于,提供一种小众app分类系统,提高了小众app的分类准确性。
根据本发明第一方面,提供了一种小众app分类系统,包括预先构建的第一数据库和第二数据库,预先训练的app分类模型和app目标向量生成模型存储有计算机程序的存储器和处理器,所述第一数据库存储有小众app特征信息记录,所述小众app特征信息记录包括小众app id和对应的多个app特征信息;所述第二数据库存储有小众app序列表和小众app初始向量映射表,所述小众app序列表包括小众app安装序列表、小众app卸载序列表以及小众app活跃序列表中的一种或多种;所述app分类模型基于第一样本小众app在所述第一数据库对应的特征信息训练得到;所述app目标向量生成模型基于所述第二数据库中的样本用户id对应的小众app序列记录和小众app初始向量映射表训练得到,所述小众app为安装量小于预设安装量的app;
当所述处理器在执行所述计算机程序时,实现以下步骤:
步骤S1、基于所述第一数据库中的每一小众app特征信息记录生成输入特征向量,并输入到所述app分类模型中,得到每一小众app的类别标签,从而生成M类小众app;
步骤S2、将每一所述小众app初始向量输入所述app目标向量生成模型,生成每一小众app对应的目标向量;
步骤S3、获取每一类小众app对应的中心向量,基于每一类小众app对应的中心向量和每一类小众app中所有小众app的目标向量得到每一类小众app对应的类内距离和类间距离,将类内距离和类间距离小于预设预设比值的小众app类别中的所有小众app的类别标签变更为第(M+1)类别;
步骤S4、将类内距离和类间距离大于等于预设预设比值的小众app类别确定为待处理类别,设定初始半径,对于每一所述待处理类别,以预设的半径递增步长调整半径,获取所述待处理类别在每一半径下的小众app密度和小众app召回率,基于所述待处理类别在不同半径下的app密度分布和app召回率分布从所述待处理类别确定实际属于该类别的小众app,将未被确定的小众app的标签变更为第(M+1)类别。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种小众app分类系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云深科技有限公司,未经杭州云深科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110734914.0/2.html,转载请声明来源钻瓜专利网。