[发明专利]一种声音推荐方法、装置、计算机设备和存储介质在审
申请号: | 202210179939.3 | 申请日: | 2022-02-25 |
公开(公告)号: | CN114579797A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 谭又伟;丁宁 | 申请(专利权)人: | 广州欢聊网络科技有限公司 |
主分类号: | G06F16/635 | 分类号: | G06F16/635 |
代理公司: | 广州佳睿知识产权代理事务所(普通合伙) 44610 | 代理人: | 李健富 |
地址: | 510000 广东省广州市天*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声音 推荐 方法 装置 计算机 设备 存储 介质 | ||
本发明实施例涉及一种声音推荐方法、装置、计算机设备和存储介质,所述方法包括:基于目标对象在历史时间段内播放声音的播放行为数据、正反馈行为数据、目标对象曝光的声音数据确定目标对象对各主播的偏好权重,并基于目标对象对各主播的偏好权重确定目标对象的偏好主播集合:过滤目标对象的偏好主播集合中实时负反馈主播集合的主播,以及过滤目标对象的关注主播集合中实时负反馈主播集合的主播,并根据过滤后的偏好主播集合、关注主播集合召回主播所发布声音并推荐给目标对象。提高了声音推荐的准确性。
技术领域
本申请涉及计算机技术领域,具体是涉及一种声音推荐方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的不断发展,在线音频平台也得到了日益广泛的应用,用户可以通过在线音频平台收听各种各样的声音。在线音频平台会为用户推荐声音,传统的声音推荐方法包括基于索引推荐、item2vec、基于graph。
其中,基于索引推荐方法,其通过用户行为,收集用户标签偏好,然后推荐含有该标签的声音。
缺点:
考虑粒度太粗,仅仅是考虑到用户对标签的偏好,没有考虑用户更细维度的偏好。
item2vec,其将用户的行为序列视作一个句子,序列中的声音视作词,然后用word2vec模型进行训练,就得到了声音的embedding。
缺点:
马太效应严重,用户对长尾的声音行为比较少,这些长尾声音的embedding效果不理想;
声音冷启动问题严重,新的声音还没有用户产生行为,因而新声音不会出现在用户的行为序列中,这样就得不到新声音的embedding。
基于graph,其基于用户对声音的行为构建graph,然后从每个结点为出发点,根据权重做随机游走,这样就可以形成新的声音序列,最后对这些不同的声音序列继续使用word2vec模型,得到声音的embedding向量。
缺点:
随机游走策略,会引入比较大的噪声;
马太效应严重,用户对长尾的声音行为比较少,这些长尾声音的embedding效果不理想;
声音冷启动问题严重,新的声音还没有用户产生行为,因而新声音不会出现在graph中,这样就得不到新声音的embedding。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种声音推荐方法、装置、计算机设备和存储介质,提高了声音推荐的准确性。
第一方面,本发明实施例提供了一种声音推荐方法,所述方法包括以下步骤:
获取目标对象在设定的历史时间段内播放声音的历史行为数据、目标对象曝光的声音数据、关注主播集合、取消关注主播集合,以及目标对象在历史时间段内最后N个预设时间周期内对主播曝光次数;所述历史行为数据包括播放行为数据、正反馈行为数据;
基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的播放行为的权重、时间衰减系数、播放行为TF-IDF值确定目标对象在相应预设时间周期内对相应主播的播放行为权重;基于目标对象在历史时间段内的每个预设时间周期内对主播所发布声音的正反馈行为的权重、时间衰减系数、正反馈行为TF-IDF值、正反馈行为次数确定目标对象在相应预设时间周期内对相应主播的正反馈行为权重;基于目标对象在各预设时间周期内对各主播的播放行为权重、以及目标对象在各预设时间周期内对各主播的正反馈行为权重确定目标对象对各主播的偏好权重;基于目标对象对各主播的偏好权重确定目标对象的偏好主播集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州欢聊网络科技有限公司,未经广州欢聊网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210179939.3/2.html,转载请声明来源钻瓜专利网。