[发明专利]小众app分类系统在审
申请号: | 202110734914.0 | 申请日: | 2021-06-30 |
公开(公告)号: | CN115618279A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 俞锋锋;吕繁荣;尹祖勇;李正;曾昱深 | 申请(专利权)人: | 杭州云深科技有限公司 |
主分类号: | G06F18/2411 | 分类号: | G06F18/2411;G06F18/214 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 丁慧玲 |
地址: | 310030 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 小众 app 分类 系统 | ||
1.一种小众app分类系统,其特征在于,
包括预先构建的第一数据库和第二数据库,预先训练的app分类模型和app目标向量生成模型存储有计算机程序的存储器和处理器,所述第一数据库存储有小众app特征信息记录,所述小众app特征信息记录包括小众app id和对应的多个app特征信息;所述第二数据库存储有小众app序列表和小众app初始向量映射表,所述小众app序列表包括小众app安装序列表、小众app卸载序列表以及小众app活跃序列表中的一种或多种;所述app分类模型基于第一样本小众app在所述第一数据库对应的特征信息训练得到;所述app目标向量生成模型基于所述第二数据库中的样本用户id对应的小众app序列记录和小众app初始向量映射表训练得到,所述小众app为安装量小于预设安装量的app;
当所述处理器在执行所述计算机程序时,实现以下步骤:
步骤S1、基于所述第一数据库中的每一小众app特征信息记录生成输入特征向量,并输入到所述app分类模型中,得到每一小众app的类别标签,从而生成M类小众app;
步骤S2、将每一所述小众app初始向量输入所述app目标向量生成模型,生成每一小众app对应的目标向量;
步骤S3、获取每一类小众app对应的中心向量,基于每一类小众app对应的中心向量和每一类小众app中所有小众app的目标向量得到每一类小众app对应的类内距离和类间距离,将类内距离和类间距离小于预设预设比值的小众app类别中的所有小众app的类别标签变更为第(M+1)类别;
步骤S4、将类内距离和类间距离大于等于预设预设比值的小众app类别确定为待处理类别,设定初始半径,对于每一所述待处理类别,以预设的半径递增步长调整半径,获取所述待处理类别在每一半径下的小众app密度和小众app召回率,基于所述待处理类别在不同半径下的app密度分布和app召回率分布从所述待处理类别确定实际属于该类别的小众app,将未被确定的小众app的标签变更为第(M+1)类别。
2.根据权利要求1中所述的系统,其特征在于,
还实现以下步骤:
步骤S01、获取所述第(M+1)类别中每一小众app的目标向量与每一待处理类别对应的中心向量的第一距离,获取所述第一距离最小值,并与预设的第一距离阈值进行对比,若所述第一距离最小值小于所述第一距离阈值,则将该小众app的类别标签变更为所述第一距离最小值对应的待处理类别的标签。
3.根据权利要求1中所述的系统,其特征在于,
所述处理器在执行所述计算机程序时,还实现以下步骤:
步骤S10、从所述样本用户对应的小众app序列表选择一个第二样本小众app;
步骤S20、基于预设的时间窗口从所述小众app序列表中选取包含所述第二样本小众app的窗口序列,作为正样本序列;
步骤S30、从所述第一数据库中随机抽取小众app与所述第二样本小众app构建负样本序列,所述正样本序列的小众app数量和所述负样本序列的小众app数量相等;
步骤S40、基于所述小众app初始向量映射表,构建每一所述正样本序列和负样本序列对应的样本输入向量;
步骤S50、基于正样本、负样本对应的样本标签、所述正样本序列和负样本序列对应的正样本输入向量训练预设的目标向量生成模型框架,生成所述目标向量生成模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云深科技有限公司,未经杭州云深科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110734914.0/1.html,转载请声明来源钻瓜专利网。