[发明专利]音乐处理方法、音乐处理装置和程序无效
申请号: | 200910172047.5 | 申请日: | 2009-09-03 |
公开(公告)号: | CN101667420A | 公开(公告)日: | 2010-03-10 |
发明(设计)人: | 宫岛靖 | 申请(专利权)人: | 索尼株式会社 |
主分类号: | G10H1/00 | 分类号: | G10H1/00 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 陈 炜;许伟群 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音乐 处理 方法 装置 程序 | ||
技术领域
本发明涉及一种音乐处理方法、音乐处理装置和程序。
背景技术
近年来由于信息处理装置的性能改进而已经以新的方式使用数字化音乐数据。新的使用方式之一是再混合(remixing)。一般而言,再混合是指一种用于组合多段音乐的全部或者部分以组成新的整段音乐的方法。虽然再混合本身在以往已经进行过,但是对于没有专用设备的用户而言变得更容易使用PC(个人计算机)来再混合音乐数据,从而使更多用户再混合数据并且更多再混合数据在用户之间交换。另外,其中与显示的画面或者幻灯片的场景关联地播放音乐的幻灯片放映是音乐数据的新用途之一。这样的幻灯片放映已经广泛地使用在活动和产品推广时的演示中。
当在再混合或者幻灯片放映中使用音乐数据时,使用附加于音乐数据的元数据是有效的。元数据不仅包括比如标题和艺人姓名这样的静态数据,而且包括通过对音乐数据的时序分析而获得的数据,比如节奏、节拍位置、小节长度或者位置、和弦进展和旋律类型。当使用这样的时序元数据时,变得更易于从音乐数据提取特定小节或者调整节奏和节拍位置。
另外,只是享受播放音乐的其他用户可以利用元数据。例如使用由元数据表明的音乐特征在海量存储器介质如硬盘或者闪存中存储的段数众多的音乐数据之中快速地搜索所需音乐数据是有效的。
有鉴于此,已经开发用于生成与音乐数据有关的元数据或者支持使用元数据的技术。例如,日本专利申请特许公开2007-248895公开了一种元数据创建装置,其能够自动提取音乐数据中的节拍位置或者小节头部位置并且向用户提供该数据使得用户可以容易地校正该数据。日本专利申请特许公开2008-164932公开了一种音乐编辑装置,其能够通过使用应用于音乐的元数据如节拍位置来适当地调整音乐数据播放的定时。
发明内容
然而,在不同环境中记录于介质中的音乐数据可能由于数据读取装置的差别或者编码参数的差别而即使在原始音乐相同时仍然造成从数据开始点到演奏开始点的偏移差异。例如,当与音乐数据分开地提供时序元数据时,偏移差异可能造成元数据没有与音乐数据匹配。当元数据没有与音乐数据匹配时,使用元数据的再混合、幻灯片放映或者音乐数据搜索可能并不能提供用户所期待的结果。
已经鉴于上述问题而做出了本发明,并且希望提供一种无论偏移差异如何仍然使用音乐数据或者音乐数据的元数据的新型或者改进的音乐处理方法、音乐处理装置和程序。
根据本发明的一个实施例,提供了一种包括以下步骤的音乐处理方法:根据音乐数据中在时间轴上从编码开始位置开始的每一定时段中的音量转变来确定代码值;并且使用在多个时段上确定的系列代码值来生成表明音乐数据的音量转变特征的特征模式。
代码值可以表明一定时段中的平均音量是从先前时段的平均音量增加还是减小。
音乐处理方法还可以包括以下步骤:通过获取音乐数据中在时间轴上的窗口宽度中的平均音量第一次超过全部或者部分音乐数据的平均音量时的窗口位置来确定编码开始位置。
音乐处理方法还可以包括以下步骤:通过比较针对音乐数据生成的特征模式与任意音乐数据的特征模式来计算音乐数据的特征模式的相似度。
相似度可以计算为两个特征模式之间的匹配代码值的位数与总位数之比。
可以基于表明在两个特征模式之间代码值匹配的位和表明代码值不匹配的位在二项式分布中的出现概率来计算相似度。
可以基于两个特征模式的代码值的连续匹配部分的最大长度来计算相似度。
音乐处理方法还可以包括以下步骤:基于与相似度高的两段音乐数据的特征模式对应的编码开始位置来校正音乐数据的偏移或者与音乐数据有关的元数据的偏移。
在确定编码开始位置的步骤中,可以使用不同窗口宽度来确定多个编 码开始位置,并且在生成特征模式的步骤中可以基于多个编码开始位置来生成一段音乐数据的多个特征模式。
音乐处理方法还可以包括以下步骤:通过比较针对音乐数据生成的各个特征模式与任意音乐数据的特征模式来计算针对各个特征模式的相似度;并且基于与多个特征模式之中计算的相似度最高的特征模式对应的编码开始位置来校正音乐数据的偏移或者与音乐数据有关的元数据的偏移。
根据本发明的另一实施例,提供了一种包括以下步骤的音乐处理方法:获取音乐数据中在时间轴上的窗口宽度中的平均音量第一次超过全部或者部分音乐数据的平均音量时的窗口位置;并且基于音乐数据的窗口位置来校正音乐数据的偏移或者与音乐数据有关的元数据的偏移。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼株式会社,未经索尼株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910172047.5/2.html,转载请声明来源钻瓜专利网。