[发明专利]自动进行音频内容分析的系统和方法有效
申请号: | 99127080.0 | 申请日: | 1999-12-28 |
公开(公告)号: | CN1261181A | 公开(公告)日: | 2000-07-26 |
发明(设计)人: | 德拉古丁·皮特科维奇;杜尔斯·比特里斯·庞塞龙;萨维萨·斯里尼瓦桑 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 杨国旭 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 进行 音频 内容 分析 系统 方法 | ||
1.一个用计算机实现的方法,用于分析一个音频信号,包括:
检测音频信号中一个或者多个间隔中的音频事件,每一个间隔包括一个或者多个段的临时序列;
分析这些音频事件,来用相关的可信度标识语音边界;
根据语音边界和可信度,使用改善查准率的探索式决定规则来索引音频信号;
使用用于改善查全率的一个相关权重来索引音频信号中至少一个词的替代;和
执行下面中的一个或者多个:词识别,概述,和快速浏览,使用其索引的音频信号。
2.一个计算机包括一个数据保存装置,这个数据保存装置包括一个计算机可使用的媒质,这个媒质具有用于对至少一个音频信号进行分类和索引的计算机可使用代码装置,这个计算机可使用代码装置包括:
逻辑装置,用于将音频信号分成多个间隔,每一个间隔包括一个或者多个段;
逻辑装置,用于判断一个间隔的段是否具有一个或者多个预定音频特征,每一个音频特征是至少一个相应音频事件的表示;
逻辑装置,用于通过对判断装置作出响应,将间隔与相应的音频事件相关,来对间隔进行分类;
逻辑装置,用于判断至少一组间隔是否与一预定元图案集合中一个元图案匹配;
逻辑装置,当它判断这组间隔与一个元图案匹配时,将这组间隔与一个元图案类型相关;和
逻辑装置,用于根据间隔类型和元图案类型来索引音频信号。
3.如权利要求2的这个计算机,进一步包括:
逻辑装置,用于使用从信号中翻译词的一个语音识别引擎来仅处理音频信号中的相关部分;
逻辑装置,用于从这个引擎接收对至少某些词的替代词;
逻辑装置,用于从这个引擎接收对至少某些词的可信度和替代词;和
逻辑装置,用于至少是部分根据可信度来索引词和替代词。
4.如权利要求3的这个计算机,其中仅接收长度长于“N”个字符并且其可信度大于百分之“x”的替代词。
5.如权利要求4的这个计算机,其中根据相应的权重来索引词和替代词。
6.如权利要求2的这个计算机,其中每一个预定音频特征是基于下面的一个或者多个:至少一部分音频信号的过零率,至少一部分音频信号的能量,至少一部分音频信号的的谱能量密度;和频率。
7.如权利要求2的这个计算机,其中预定音频事件集合包括音乐,语音,沉默,和关于音乐的语音。
8.如权利要求2的这个计算机,进一步包括:
逻辑装置,用于在对间隔分类前,归一化段。
9.如权利要求8的这个计算机,其中预定图案集合包括连续的、非中断语音,和带语音的音乐,预定图案集合是探索式定义的。
10.如权利要求8的这个计算机,进一步包括逻辑装置,用于提供至少一部分间隔和元图案类型,以使用这个信号的索引来快速浏览,找要旨,和概述音频信号。
11.如权利要求2的这个计算机,其中用于判断一个间隔的段是否具有一个或者多个预定音频特征的逻辑装置包括:
装置,用于对一个间隔中的每一段,判断与这个段相关的一个或者多个音频特征是否等于一个相应的阈值;
装置,当相应特征等于相应阈值时,用于增加与一个或者多个音频特征相应的一个或者多个计数器;和
装置,用于将一个或者多个计数器与这个间隔中段的总数目相比,用于对间隔进行分类的逻辑装置根据比较装置来执行对间隔的分类。
12.如权利要求2的这个计算机,其中预定音频事件集合进一步包括语音中的重音,语音的停顿,和语音中总结想法,这样用于索引的逻辑装置可以根据其对音频信号进行索引。
13.如权利要求12的这个计算机,进一步包括:
装置,用于判断被对间隔进行分类的逻辑装置分类为语音的至少一个间隔中的一个或者多个主要频率;
装置,用于当一个或者多个段包括上N%的主要频率时,将一个或者多个段与语音中的重音相关,其中N是一个数;和
装置,用于当一个或者多个段包括下N%的主要频率时,将一个或者多个段与语音中的总结想法相关,其中N是一个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/99127080.0/1.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法