[发明专利]为基于生成和检索的应用学习有效音乐特征的技术在审
申请号: | 202080042427.1 | 申请日: | 2020-06-01 |
公开(公告)号: | CN113939870A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | P.M.布雷坦;L.P.海克;金红霞 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/30;G06F16/638;G06F16/65;G06N3/04;G06N3/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 钱大勇 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 检索 应用 学习 有效 音乐 特征 技术 | ||
一种方法包括接收与输入音乐内容相关联的非语言输入。该方法还包括,使用在潜在空间中嵌入描述不同音乐内容和在不同音乐内容之间的关系的多个音乐特征的模型,基于输入音乐内容识别一个或多个嵌入物。该方法还包括至少以下之一:(i)基于一个或多个识别的嵌入物识别存储的音乐内容,或者(ii)基于一个或多个识别的嵌入物生成导出的音乐内容。此外,该方法包括呈现存储的音乐内容或导出的音乐内容中的至少一个。通过训练包括一个或多个第一神经网络组件和一个或多个第二神经网络组件的机器学习系统来生成该模型,使得在潜在空间中的音乐特征的嵌入物具有预定义的分布。
技术领域
本公开总体上涉及机器学习系统。更具体地,本公开涉及用于为基于生成和检索的应用学习有效音乐特征的技术。
背景技术
音乐本质上是复杂的,一个单一的音乐主题或风格往往可以沿着多个维度来描述。一些维度可以广义地描述音乐,并获取提供音乐的更聚合表示的属性。这些维度可能包括音乐特征,如调性、音符密度、复杂性和乐器。其他维度可以通过考虑音乐的顺序性质和时间方面来描述音乐。这些维度可能包括诸如切分音、和声推进、音高轮廓和重复等音乐特征。
近年来,神经网络被用来学习一个低维的潜在“音乐空间”,该“音乐空间”封装了这些类型的音乐特征。不同的音乐段落可以与诸如空间中的不同矢量之类的空间中的不同嵌入物相关联,或者由空间中的不同嵌入物来表示。空间中两个嵌入物之间的距离可以用作两个音乐段落之间相似性的度量。彼此更相似的音乐段落可以用相隔更小距离的嵌入物来表示。彼此不太相似的音乐段落可以用相隔更大距离的嵌入物来表示。
发明内容
【技术解决方案】
本公开提供了用于为基于生成和检索的应用学习有效音乐特征的技术。
在第一实施例中,一种方法包括接收与输入音乐内容相关联的非语言输入。该方法还包括,使用在潜在空间中嵌入描述不同音乐内容和在不同音乐内容之间的关系的多个音乐特征的模型,基于输入音乐内容识别一个或多个嵌入物。该方法还包括至少以下之一:(i)基于一个或多个识别的嵌入物识别存储的音乐内容,或者(ii)基于一个或多个识别的嵌入物生成导出的音乐内容。此外,该方法包括呈现存储的音乐内容或导出的音乐内容中的至少一个。通过训练具有一个或多个第一神经网络组件和一个或多个第二神经网络组件的机器学习系统来生成该模型,使得在潜在空间中的音乐特征的嵌入物具有预定义的分布。
在第二实施例中,电子设备包括至少一个存储器、至少一个扬声器和至少一个可操作地耦合到至少一个存储器和至少一个扬声器的处理器。该至少一个处理器被配置成接收与输入音乐内容相关联的非语言输入。所述至少一个处理器还被配置为使用在潜在空间中嵌入描述不同音乐内容和在不同音乐内容之间的关系的多个音乐特征的模型,基于输入音乐内容识别一个或多个嵌入物。所述至少一个处理器还被配置为至少以下之一:(i)基于一个或多个识别的嵌入物识别存储的音乐内容,或者(ii)基于一个或多个识别的嵌入物生成导出的音乐内容。此外,所述至少一个处理器被配置成经由所述至少一个扬声器呈现存储的音乐内容或导出的音乐内容中的至少一个。通过训练具有一个或多个第一神经网络组件和一个或多个第二神经网络组件的机器学习系统来生成该模型,使得在潜在空间中的音乐特征的嵌入物具有预定义的分布。
在第三实施例中,非暂时性机器可读介质包含指令,当指令被执行时,使得电子设备的至少一个处理器接收与输入音乐内容相关联的非语言输入。该介质还包含指令,当被执行时,该指令使得至少一个处理器使用在潜在空间中嵌入描述不同音乐内容和在不同音乐内容之间的关系的多个音乐特征的模型,基于输入音乐内容识别一个或多个嵌入物。该介质还包含指令,该指令在被执行时使得至少一个处理器执行至少以下之一:(i)基于一个或多个识别的嵌入物识别存储的音乐内容,或者(ii)基于一个或多个识别的嵌入物生成导出的音乐内容。此外,该介质包含指令,该指令在被执行时使得至少一个处理器呈现存储的音乐内容或导出的音乐内容中的至少一个。通过训练具有一个或多个第一神经网络组件和一个或多个第二神经网络组件的机器学习系统来生成该模型,使得在潜在空间中的音乐特征的嵌入物具有预定义的分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080042427.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于图像到视频重识别的系统和方法
- 下一篇:用于机动车辆的变速器