[发明专利]一种基于自注意力机制和CNN的音乐推荐方法在审
申请号: | 202310192158.2 | 申请日: | 2023-03-02 |
公开(公告)号: | CN116401397A | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 白小东;张学旺 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/635 | 分类号: | G06F16/635;G06N3/0464 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 cnn 音乐 推荐 方法 | ||
本发明请求保护一种基于自注意力机制的和卷积神经网络(CNN)的推荐方法,属于推荐算法领域。该方法包括:利用用户收听数据创建序列和音乐序列特征矩阵,指数平滑后的特征矩阵输入卷积神经网络和使用自注意力机制的神经网络,通过使用自注意力网络学习序列数据的内在联系,卷积神经网络学习简化相应的特征矩阵,将最终的学习结果通过预测层进行音乐预测。本发明能够综合音乐数据的多维性提高推荐系统的准确性,缓解数据稀疏性的问题。
技术领域
本发明专利属于音乐推荐领域,涉及一种基于自注意力机制和卷积神经网络的深度学习音乐推荐方法。
背景技术
近年来,电子图书、音乐、视频等数字化作品的数量呈现爆发式增长,在海量的数据中找到有用的数据是当今时代的一大难题,应用推荐技术是解决数据过载的一种有效的方式。同时,深度学习技术在各个领域均取得了巨大成功,将二者结合成为学者们研究的一个热点方向。
但是,目前的推荐技术大多仅利用用户-项目交互历史,忽略了其他维度的数据信息,这导致了推荐结果的精准性还存在提高的空间。同时,由于推荐任务的特殊性,用户对于推荐结果不满意存在诸多因素,因为用户的品味和音乐需求在很大程度上受到多种因素的影响,但大多数现有音乐平台往往忽略用户的长期偏好,或在推荐时未充分考虑到历史信息和当前情境中包含的时间关联和音乐内容属性,并且由于数据的稀疏性,导致推荐性能的下降,这些均是音乐推荐中亟待解决的问题。
传统推荐方法基于音乐的多模态数据作为了嵌入层的输入数据,与序列数据直接拼接的做法使得序列数据过于冗杂,它们始终生成标记表示执行歌曲预测并从头到尾训练他们的架构。这在使用大量数据时带来了困难并且限制了方法的可扩展性。其次,他们并没有使用更多相关数据来提取歌曲诸如声学内容的特征。在本方法中将重点放在关于使用多模态的多种歌曲表示融合方法,利用会话,而不是使用以生成顺序表示,利用个别模式,研究例如声学特征和歌词等的影响,并通过将它们与顺序表示相结合,提高了方法的扩展性以及预测性能。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种基于自注意力机制和CNN的音乐推荐方法。本发明的技术方案如下:
一种基于自注意力机制和CNN的音乐推荐方法,其包括以下步骤:
S1:获取用户的音乐播放历史,并创建用户音乐历史序列;
S2:根据用户音乐历史序列,提取音乐内容特征矩阵;
S3:利用卷积神经网络对音乐序列内容进行特征处理;特征处理指的是如何将音乐多模态数据包括声乐特征、歌曲、作家、歌词等特征融合为新的网络,利用卷积神经网络的潜在空间学习它们的内在联系,最终反应到输出预测层。
S4:自注意网络层:本步骤是与S3并行的步骤,在本层处理学习纯序列数据的内在属性,其中包括多个自注意力模块,每个模块为两层全连接层,每层传递时采用自注意力机制进行连接;
S5:预测层,在获取到自注意力和卷积神经网络层的输出后实现音乐推荐任务。
进一步的,所述步骤S1获取用户的音乐播放历史,并创建用户音乐历史序列,
具体包括以下步骤:
S11:根据时间的先后顺序对用户的收听记录予以排序从而生成用户的收听序列,与此同时对音乐进行编码,每首歌曲都拥有唯一标识;
S12:选取在所有用户的序列长度最大的序列,对其他序列进行补长操作,具体为在序列的首端补0填充长度。
进一步的,所述步骤S2根据用户音乐历史序列,提取音乐内容特征矩阵,具体包括以下步骤:
S21:提取相应的音乐的内容特征,具体包括频率中心、短时平均能量、过零率、梅尔频率倒谱系数、带宽;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310192158.2/2.html,转载请声明来源钻瓜专利网。