[发明专利]利用音调匹配访问音频文件集中的音频文件的方法和装置有效
申请号: | 200780019080.3 | 申请日: | 2007-05-22 |
公开(公告)号: | CN101454778A | 公开(公告)日: | 2009-06-10 |
发明(设计)人: | 许军;张化云 | 申请(专利权)人: | 创新科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 | 代理人: | 宋 鹤;南 霆 |
地址: | 新加坡*** | 国省代码: | 新加坡;SG |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 音调 匹配 访问 音频文件 集中 方法 装置 | ||
技术领域
本发明涉及用于访问音频文件集(collection of audio files)中的音频 文件的方法和装置,并且更具体而言,涉及利用音调匹配对文件的访问。
背景技术
能够购买数字娱乐年代的出现已经在很大程度上增加了消费者对个人 数字娱乐设备的使用。这些个人数字娱乐设备通常设有一定大小的存储容 量。由于诸如硬盘驱动和闪存之类的存储设备的价格下降,存储容量超过 1GB的个人数字娱乐设备的数目增加了。个人数字娱乐设备中的用于音频 文件的这种大小的存储容量使得能够存储成千上万份文件。
虽然可以将音频文件根据它们的歌曲标题、演唱者、流派等进行存储 和分类,但是存在这样的情况:用户可能忘记了歌曲的标题或演唱者,因 而提供对相关音频文件的搜索类似于大海捞针。在很多情况下,用户可能 只能够忆起歌曲或者其曲调的一部分。此时,这不能以任何方式来帮助搜 索相关的音频文件。当试图访问很大音频文件集中的音频文件而不知道某 些诸如歌曲名或演唱者之类的信息的时候,这便成了一个问题。当视觉受 损者试图访问音频文件集中的音频文件而他们不能够通过使用视觉来选择 音频文件时,这个问题更加严重。
在没有使其参加昂贵的歌唱训练(vocal coach)的情况下,要提高人 的歌唱技能也是相当困难的。当前,除了使用其中设有“评分”功能的卡 拉OK机以外,很难独立地提高人的歌唱技能。现在,还很少有可用的能 够容易且方便地判定人歌唱技能质量的设备。
发明内容
在本发明的一个优选方面中,提供了一种用于访问包括存储在电子设 备中或者通过电子设备可访问的多于一个音频文件的集合中的至少一个音 频文件的方法。该方法包括:生成一个索引,所述索引包括从该集合中多 于一个音频文件的每个获取的信息条目的索引,该集合中的每个音频文件 被链接到至少一个信息条目;在输入接收模式期间接收输入;利用模数转 换器将输入转换为数字信号;利用频谱分析或旋律轮廓分析将数字信号解 析为离散部分;以及比较离散部分与索引中的信息条目。优点在于当离散 部分与索引中的至少一个信息条目基本匹配时,音频文件被访问。优选 地,离散部分例如是音符、旋律轮廓或波形。至少一个信息条目也可以是 音符、旋律轮廓或波形。优选地,旋律轮廓分析基于对每个音频文件的音 频输出的一阶旋律轮廓(UDR)、二阶旋律轮廓(udr)以及持续时间轮 廓(LSK)进行的分析,其中所述分析生成用于音频文件匹配的“接近 (closeness)”评分。
输入优选地可以是独立于扬声器的并且可以是歌唱、哼唱、口哨、 MIDI信号以及音符的形式。输入形式优选地可以是手动可选择的或自动 可选择的。
优选地,音频文件可以从电子设备本身、功能上连接到该电子设备的 设备或者被连接的计算机网络进行访问。优选地,信息条目也可以从音频 文件、链接到音频文件的预先记录的歌唱条目以及被连接的计算机网络来 接收。优选地,电子设备可以从由以下选项组成的组中选择:车载音频系 统、桌上型计算机、笔记本计算机、PDA、便携式媒体播放器以及移动电 话。
优选地,该方法还包括通过按下预定按钮至少一次来选择用于访问所 述音频文件的装置(facility),并且对输入进行滤波。
还提供了一种用于访问包括存储在电子设备中或者通过电子设备可访 问的多于一个音频文件的集合中的至少一个音频文件的装置。优选地,该 装置包括:用于生成包括从集合中多于一个音频文件的每个获取的信息条 目的索引的索引器,其中,集合中的每个音频文件被链接到至少一个信息 条目;用于在输入接收模式期间接收输入的输入接收接收器;使用模数转 换器将输入转换为数字信号;以及被配置为利用频谱分析或旋律轮廓分析 将数字信号解析为离散部分的处理器,该处理器还可以比较离散部分与索 引中的信息条目。优点在于当离散部分与索引中的至少一个信息条目基本 匹配时,音频文件被访问。该装置可以包括显示屏并且输入可以被滤波。 输入接收模式可以通过按下至少一个按钮至少一次来激活。优选地,离散 部分是音符、旋律轮廓或波形。优选地,旋律轮廓分析基于对每个音频文 件的音频输出的一阶旋律轮廓(UDR)、二阶旋律轮廓(udr)以及持续 时间轮廓(LSK)进行的分析,其中所述分析生成用于音频文件匹配的 “接近”评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新科技有限公司,未经创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780019080.3/2.html,转载请声明来源钻瓜专利网。