[发明专利]声音处理装置、声音处理方法、程序、记录介质、服务器装置、声音再现装置以及声音处理系统无效

申请号：	201280058754.1	申请日：	2012-11-28
公开（公告）号：	CN103988256A	公开（公告）日：	2014-08-13
发明（设计）人：	角尾衣未留;井上晃	申请（专利权）人：	索尼公司
主分类号：	G10L25/54	分类号：	G10L25/54;G06F17/30;G10H1/00
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	朱胜;陈炜
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声音处理装置方法程序记录介质服务器再现以及系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本技术涉及一种声音处理装置、声音处理方法、程序、记录介质、服务器装置、声音再现装置以及声音处理系统，并且更具体地涉及一种用于优选地识别与输入声音信号相对应的音乐片段的声音处理装置等。

背景技术

针对用户从大量音乐片段中再现音乐片段的情况，作为用于容易地搜索音乐片段的方法，已经提议了歌唱和哼唱搜索(例如，参见专利文献1)。

引用列表

专利文献

专利文献1：日本专利申请公开第2000-356996号

发明内容

发明要解决的问题

根据专利文献1中所描述的搜索系统，在用户歌唱(或哼唱)之后开始搜索处理。因此，系统缺乏实时能力。

本技术的目的是使得能够优选地识别与输入声音信号相对应的音乐片段。

问题的解决方案

本技术的一个方面是一种声音处理装置，包括：

转换单元，配置成将连续输入的声音信号转换成预定特征量序列；以及

音乐识别单元，配置成在累积了预定量的预定特征量序列时，按顺序地执行特征量序列相对于音乐信息的核对处理，并且配置成识别具有大于第一阈值的匹配程度的音乐片段。

关于本技术，转换单元将连续输入的声音信号转换成预定特征量序列。例如，通过经由麦克风输入用户的歌唱语音(包括哼唱)、环境声音等获得连续输入的声音信号。特征量序列被描述为例如音高序列，但是特征量序列可以是其他序列，诸如音韵序列等。

音乐识别单元在累积了预定量的预定特征量序列时，按顺序地执行特征量序列相对于音乐信息的核对处理。之后，音乐识别单元识别具有大于第一阈值的匹配程度的音乐片段。例如，在每个排定的时间或每当之前的核对处理结束时执行核对处理。

以这种方式，关于本技术，并行地执行连续输入的声音信号到预定特征量序列的转换和特征量序列相对于音乐信息的核对处理的执行。这使得能够进行具有良好实时能力的音乐识别。

在此，关于本技术，例如，音乐识别单元可以从核对处理的对象中移除在之前的核对处理中具有小于第二阈值的匹配程度的音乐片段，第二阈值设置为小于第一阈值。在这种情况下，随着时间经过可以按顺序地缩减核对处理的对象，并且可以更高效地执行音乐识别。

此外，关于本技术，例如，随着时间经过，音乐识别单元可以将第一阈值和/或第二阈值改变为更大。在这种情况下，可以精确地识别音乐片段，而无需从核对处理的对象中移除与连续输入的声音信号相对应的音乐片段。

此外，例如，本技术还可以包括音乐再现单元，该音乐再现单元配置成基于关于音乐片段和正在被歌唱的音乐部分的信息，与连续输入的声音信号同步地对所识别出的音乐片段进行再现。在这种情况下，例如，可以提供有效的应用，使得用户可以舒服地跟着所再现的音乐片段继续歌唱。在这种情况下，例如，音乐再现单元可以根据连续输入的声音信号的音高和节奏，改变所再现的音乐片段的音高和节奏。

此外，例如，本技术还可以包括显示控制单元，该显示控制单元配置成基于核对处理的信息和音乐识别的信息，对音乐识别进展状态的显示进行控制。在这种情况下，用户可以容易地发现音乐识别进展状态。例如，显示控制单元可以进行控制，以基于处理结果按匹配程度的降序显示作为核对处理的对象的音乐片段。用户可以容易地辨识出哪个音乐片段要被识别。

在这种情况下，还可以包括音乐再现单元，该音乐再现单元配置成基于关于音乐片段和正在被歌唱的音乐部分的信息，与连续输入的声音信号同步地对从所显示的音乐片段中所选择的音乐片段进行再现。

在这种情况下，用户可以选择与用户的歌唱相对应的音乐片段，并且可以立即地同步地对该音乐片段进行再现。

此外，例如，本技术还可以包括音乐缩减单元，该音乐缩减单元配置成从对其执行了预定分类的多个音乐片段中选择一些音乐片段，并且音乐识别单元可以将在音乐缩减单元中所选择的一些音乐片段作为核对处理中的对象。例如，预定分类可以是，根据类别和艺术家进行的分类，根据收听频率进行的分类，或根据用户是否喜爱该音乐进行的分类等。在这种情况下，可以缩减核对处理的对象，并且可以改进音乐识别的精度。此外，因为可以省略不必要的核对处理，所以缩短了识别音乐所需要的时间。

另外，本技术的另一个方面是一种声音处理系统，包括经由网络所连接的声音再现装置和服务器装置，其中

声音再现装置包括：

转换单元，配置成将连续输入的声音信号转换成预定特征量序列；

传送单元，配置成将预定特征量序列传送至服务器装置；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于索尼公司，未经索尼公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201280058754.1/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]声音处理装置、声音处理方法、程序、记录介质、服务器装置、声音再现装置以及声音处理系统无效

专利文献下载