[发明专利]孪生网络模型训练、度量方法、装置、介质和设备有效
申请号: | 202110113716.2 | 申请日: | 2021-01-27 |
公开(公告)号: | CN112784130B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 李鹏;曹偲;潘颂声;刘华平;赵翔宇;熊贝尔;陈梦;金强;蔡苗苗;白杨 | 申请(专利权)人: | 杭州网易云音乐科技有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/65;G06F16/9535;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 万晓君 |
地址: | 310052 浙江省杭州市萧山区钱江世*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 孪生 网络 模型 训练 度量 方法 装置 介质 设备 | ||
本公开涉及一种孪生网络模型训练、度量方法、装置、介质和设备。先预训练一个标签分类模型,然后利用训练出的标签分类模型,通过增加编码神经网络分支的方式,构造孪生网络模型,从而可以基于包括标签分类学习和度量学习的多任务学习的方式,训练得到用于推荐系统中的数据相似度度量的孪生网络模型。通过分阶段训练以及多任务学习约束的方式,可以有效提高模型的稳定性和泛化能力,并提高训练出的用于推荐系统中的数据相似度度量的孪生网络模型的准确性。进一步的,可以基于训练出的孪生网络模型进行数据相似度度量,有效提高数据相似度度量的准确性。将训练出的孪生网络模型用于歌曲相似度度量,即可以有效提高歌曲相似度度量的准确性。
技术领域
本公开涉及互联网技术领域,特别涉及一种孪生网络模型训练、度量方法、装置、介质和设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
推荐系统中的数据相似度度量具有广泛的应用价值,因此受到了极大的重视。进行相似度度量的数据可以为任意类型,例如,可以为音频(如音乐)类型、或视频类型或者文本类型(如新闻)等等。但是目前的数据相似度度量的准确性仍然难以得到保证。
以进行歌曲相似度度量为例,歌曲相似度度量对音乐分发、歌曲推荐、歌曲关联、曲库管理、音乐制作都有明显的促进作用。歌曲相似度度量可以从很多维度考虑,包括从歌手、歌词、流派、用户收听行为等维度进行歌曲相似度度量。
例如,进行歌曲相似度度量时,可以认为同一个歌手的作品可能具有较高的相似度;两首歌的歌词有数量较多的共有词汇,则可能具有较高的相似度;同属于摇滚流派的歌曲,在听感上可能比较相似,可能具有较高的相似度;两首歌在众多用户的收藏中同时出现,则可能有较高的相似度等等。
需要说明的是,上述歌曲相似度度量维度并未从歌曲音频内容本身出发,从音频信号层面来考虑如何度量歌曲间的听感相似度,因此对歌曲的相似度度量不够准确。
一般来说,两首歌曲听感上是否相似,与音频信号本身的属性密切相关,例如使用的乐器类型、演唱者的音色、旋律、和弦和节奏等等。然而,在度量两首歌曲听感相似度时,很难一一分析这些属性进行对比,即使能够拆分成不同属性,也比较难给出每个属性上的相似度度量方法,以及最终的融合策略。因此,基于音频内容的歌曲相似度度量,一般是从音频信号中抽取特征,建立机器学习模型,通过回归、分类等方式来判断两首歌曲的相似度,或者直接基于相关性(correlation)计算,从特征中计算相关值,作为相似度打分。
但是目前相关技术基于音频特征进行歌曲相似度度量的准确性仍然有待提高。
发明内容
本公开实施例提供一种孪生网络模型训练、度量方法、装置、介质和设备,用于解决数据相似度度量的准确性较低的问题。
第一方面,本公开提供了一种用于推荐系统中的数据相似度度量的孪生网络模型训练方法,所述方法包括:
将第一样本数据作为待训练标签分类模型的输入,根据所述第一样本数据的至少一个分类标签信息,训练得到已训练的标签分类模型,所述标签分类模型包括基础神经网络和分类神经网络,所述基础神经网络用于将输入的样本数据转换为设定维度的第一向量,所述分类神经网络用于根据所述基础神经网络传入的所述第一向量输出所述至少一个标签类别下对应的分类信息;
基于所述已训练的标签分类模型构造孪生网络模型,包括:在所述标签分类模型的基础神经网络上,增加一个编码神经网络分支,所述编码神经网络用于根据所述基础神经网络传入的所述第一向量输出指定维度的第二向量;
将第二样本数据中的一对样本数据作为待训练孪生网络模型的输入,所述一对样本数据包括正样本对或者负样本对,所述正样本对包括一个样本数据以及一个与该样本数据相似的正样本数据,所述负样本对包括一个样本数据以及一个与该样本数据不相似的负样本数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易云音乐科技有限公司,未经杭州网易云音乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110113716.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于镇静患儿检查的约束垫
- 下一篇:一种正极材料及其制备方法和用途