[发明专利]用户标签的生成方法及设备在审
申请号: | 202210101598.8 | 申请日: | 2022-01-27 |
公开(公告)号: | CN114443734A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 吴嘉伟 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/958;G06V10/764;G06V10/22;G06K9/62;G10L15/26 |
代理公司: | 北京同钧律师事务所 16037 | 代理人: | 许怀远 |
地址: | 310056 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 标签 生成 方法 设备 | ||
1.一种用户标签的生成方法,其特征在于,包括:
获取预设时段内热度值大于阈值的多个目标内容;
从所述多个目标内容中确定已创建的用户标签,获取所述已创建的用户标签在所述多个目标内容中的上下文信息;
通过对所述已创建的用户标签在所述多个目标内容的上下文信息进行数据分析,生成新用户标签。
2.根据权利要求1所述的方法,其特征在于,所述获取预设时段内热度值大于阈值的多个目标内容,包括:
获取第一内容在所述预设时段内的交互统计数据,所述第一内容为用户发布的任一内容;
根据所述第一内容的交互统计数据确定所述第一内容在所述预设时段内的热度值,若所述第一内容的热度值大于所述阈值,确定所述第一内容为所述目标内容。
3.根据权利要求2所述的方法,其特征在于,所述第一内容的交互统计数据包括浏览数量、点赞数量、收藏数量、转发数量、留言数量的至少一项;
所述根据所述第一内容的交互统计数据确定所述第一内容在所述预设时段内的热度值,包括:
根据所述第一内容的各类交互统计数据以及预设的各类交互统计数据的权重值,确定所述第一内容在所述预设时段内的热度值。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述多个目标内容包括文本内容;所述从所述多个目标内容中确定已创建的用户标签,获取所述已创建的用户标签在所述多个目标内容中的上下文信息,包括:
基于文本关键词检测算法从所述文本内容中提取多个关键词;
若所述多个关键词中包含与所述已创建的用户标签相匹配的目标关键词,获取所述目标关键词在所述文本内容的上下文信息。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述多个目标内容包括视频内容;所述从所述多个目标内容中确定已创建的用户标签,获取所述已创建的用户标签在所述多个目标内容中的上下文信息,包括:
提取所述视频内容中的音频数据,基于语音识别算法将所述音频数据转化为第一文本数据,从所述第一文本数据中提取多个关键词;
若所述多个关键词中包含与所述已创建的用户标签相匹配的目标关键词,获取所述目标关键词在所述第一文本数据的上下文信息。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述多个目标内容包括图片内容;所述从所述多个目标内容中确定已创建的用户标签,获取所述已创建的用户标签在所述多个目标内容中的上下文信息,包括:
基于文字识别算法提取所述图片内容的第二文本数据,所述第二文本数据用于指示图片中的文字;
若所述第二文本数据中包含与所述已创建的用户标签相匹配的目标关键词,获取所述目标关键词在所述第二文本数据的上下文信息。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
基于所述图像识别算法提取所述图片内容的语义信息,所述语义信息用于指示图片中的目标对象的类别和属性;
根据所述语义信息生成新用户标签。
8.根据权利要求1-3任一项所述的方法,其特征在于,所述多个目标内容包括分享链接;所述从所述多个目标内容中确定已创建的用户标签,获取所述已创建的用户标签在所述多个目标内容中的上下文信息,包括:
获取所述分享链接的页面内容,所述页面内容至少包括第三文本数据;
若所述第三文本数据中包含与所述已创建的用户标签相匹配的目标关键词,获取所述目标关键词在所述第三文本数据的上下文信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210101598.8/1.html,转载请声明来源钻瓜专利网。