[发明专利]标签确定方法、装置、电子设备及存储介质在审
申请号: | 202010112968.9 | 申请日: | 2020-02-24 |
公开(公告)号: | CN111324755A | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 张志伟;吴丽军 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/45 | 分类号: | G06F16/45;G06F16/483;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 方高明 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 确定 方法 装置 电子设备 存储 介质 | ||
本公开关于一种标签确定方法、装置、电子设备及存储介质。该标签确定方法包括:获取用户账号对应的第一作品集,以及提取第一作品集中的第一作品的平均特征;其中,第一作品集中的第一作品为用户账号对应的代表作品;获取目标作品,并提取目标作品的特征;计算目标作品的特征与平均特征之间的特征差值;获取用户账号对应的用户画像标签,将用户画像标签确定为特征差值小于预设阈值的目标作品的标签。根据本公开的实施例,当特征差值小于预设阈值时,将用户账号对应的用户画像标签,确定为相应目标作品的标签,可以避免直接将用户画像标签确定为目标作品的标签造成的目标作品与标签不适用的现象,保证目标作品的内容与对应的标签的一致性。
技术领域
本公开涉及互联网技术领域,尤其涉及一种标签确定方法、装置、电子设备及存储介质。
背景技术
随着互联网技术的发展以及人们对文化艺术的大量需求,人们通过创作视频来分享生活的热情得到了前所未有的发展,短视频和各种图像作品的观看逐渐成为了人们日常接受信息的重要途径之一。对用户上传的作品进行标签确定,是进行用户、作品推荐和广告宣传的重要基础。传统作品标签确定方法一般是对上传的作品进行简单筛选,然后直接将用户画像确定为该用户上传作品的标签。
然而,同一用户上传的作品的内容并不会完全一致,简单筛选后直接将用户画像确定为该用户作品的标签,往往会将不适合作品的标签赋予相应的作品,导致部分作品标签与内容严重不一致。
发明内容
本公开提供一种标签确定方法、装置、电子设备及存储介质,以至少解决相关技术中作品标签与内容严重不一致的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种标签确定方法,包括:
获取用户账号对应的第一作品集,以及提取所述第一作品集中的第一作品的平均特征;其中,所述第一作品集中的第一作品为所述用户账号对应的代表作品;
获取目标作品,并提取所述目标作品的特征;
计算所述目标作品的特征与所述平均特征之间的特征差值;
获取所述用户账号对应的用户画像标签,将所述用户画像标签确定为所述特征差值小于预设阈值的目标作品的标签。
在一示例性实施例中,所述获取用户账号对应的第一作品集,之前包括:
获取所述第一作品集,并对所述第一作品集中的每一第一作品进行标注,得到第一标注信息;
将所述第一述标注信息确定为所述用户账号对应的用户画像标签。
在一示例性实施例中,所述获取用户账号对应的第一作品集,包括:
获取所述用户账号对应的第二作品集;其中,所述第二作品集中的第二作品为所述用户账号对应的作品;
根据所述第二作品集中的每一第二作品对应的播放量,对所述第二作品集进行筛选,得到第三作品集;
提取所述第三作品集中的每一第三作品的特征;
对所述第三作品的特征进行聚类,并根据聚类结果对所述第三作品集进行筛选,得到所述第一作品集。
在一示例性实施例中,所述根据所述第二作品集中的每一第二作品对应的播放量,对所述第二作品集进行筛选,得到第三作品集,包括:
根据所述第二作品集中的每一第二作品对应的播放量,计算所述第二作品集的平均播放量;
将所述播放量大于所述平均播放量的第二作品构成的集合,确定为所述第三作品集。
在一示例性实施例中,所述对所述第三作品的特征进行聚类,并根据聚类结果对所述第三作品集进行筛选,得到所述第一作品集,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010112968.9/2.html,转载请声明来源钻瓜专利网。