[发明专利]一种基于语义理解的音频资源管理方法有效
申请号: | 201110083131.7 | 申请日: | 2011-04-02 |
公开(公告)号: | CN102143001A | 公开(公告)日: | 2011-08-03 |
发明(设计)人: | 马建国;邢玲;朱敏 | 申请(专利权)人: | 西南科技大学 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;G10L19/00 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 621010 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 理解 音频 资源管理 方法 | ||
技术领域
本发明属于音频资源管理技术领域,更为具体地讲,在音频资源进行语义理解的基础上,建立一种高效的统一的音频资源管理机制,该管理机制具有可管、可控、可信并充分满足用户需求的特点。
背景技术
随着因特网的日益普及和音频压缩技术的飞速发展,以音乐为主的音频资源在互联网上的交流达到了前所未有的深度和广度,其发布形式也愈加丰富。
音频资源承载着丰富的信息内容,但现有技术的音频资源除了含有采样频率、量化精度、编码方法等有限的注册信息外,其本身仅仅是一种非语义符号表示和非结构化的二进制流,缺乏资源的语义描述。虽然已经有很多组织和机构投入到了此方面的研究,但目前为止还有没有一个统一的标准,因而对音频资源进行准确有效的管理和访问变得十分艰难。随着音频资源和用户数量的日益增多,现有的音频资源在源端标引、网络传输和终端解析均存在内容管理混乱、分级管理不完善和用户需求无法满足等诸多问题。究其原因是忽略了音频资源的语义,没有建立简单有效的语义标引及语义解析、理解机制而导致音频资源管理机制的不理想。
音频资源的语义标引及基于语义理解的音频资源管理近年来逐渐成为研究热点,语义标引是指对所收集到的信息单元,如音频资源给出规范化标识的过程,这些标识可以为标题、作者名、主题词等。通过语义标引,音频资源被整理为特征明显、便于检索和利用的数据记录。
活动图像专家组(Moving Picture Group,简称MPEG)制定了MPEG-7标准,它是第一个体现音视频资源信息内容,即语义标引技术的标准,可以对音频资源的多种特征进行标识,但是它并没有将音频流的分段技术以及对音频资源的特征提取作为自己的一部分,没有对音频资源进行语义解释。美国的Muscle Fish公司对带标识的数据进行加窗处理,对每帧数据提取音调、响度、带宽、能量等13个特征,则此13维特征即为音频资源的特征矢量,检索时采用马氏 距离,比较样本特征矢量与库中数据的特征矢量,从而输出检索结果。大多数研究者通过分析音频资源底层频谱特征(如MFCC等),将这些特征映射为高层语义标引,这种方法所需计算量大,过程复杂,没有很好的实际应用效果。
相比之下,国内对这方面的研究起步较晚,但已引起广泛的关注和重视。浙江大学人工智能研究所对基于内容的音频检索、广播新闻分割等领域进行了深入的研究,在国内处于领先地位。中科院中科信利语音实验室推出了基于分布式群架构的语音处理平台TSE,主要功能模块包括:语音识别、歌词检索、旋律识别及特定网站语音搜索等。清华大学对新闻的分段、音乐分类和音乐检索分类方法进行了研究,还有很多国内外的机构都致力于此项技术的开发研究,但都不同程度的存在着诸如算法处理速度慢、漏检误检率高、检索效果无评价标准、缺少支持多种检索手段等问题。而且没有从用户的角度定义其语义字段,分析语义元素,因而对用户也就缺少普通实用价值。
为了解决语义标引在网络中传输的问题,目前国内外普遍采用的都是将语义标引作为一个单独的头部文件实现在网络中的传输,这种方法容易丢失语义标引,而且一旦丢失,不易恢复。
综上,尽管音频资源的语义标引和基于语义理解的音频资源管理机制在不断的演进,但仍然缺乏简单有效的、系统的整体设计,不管是实现的复杂性还是研究的可行性都存在明显的不足。因此,需要寻求行之有效的解决方案。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于语义理解的音频资源管理方法,以解决网络中音频资源无法有效、可行地进行管理的难题,
为实现上述目的,本发明基于语义理解的音频资源管理方法,其特征在于,包括以下步骤:
(1)、在网络源端对音频资源进行资源整合
在对音频资源进行语义理解的基础上实现语义标引,从而生成该音频资源的语义标引信息;所述的语义标引是指对音频资源的语义进行多维度的标引,使形成的语义标引信息能够全方位地具体地反应一个特定的音频资源;
将音频资源的语义标引信息作为语义水印嵌入到音频资源中,得到带有语义标引信息的音频资源;
(2)、网络源端发送带有语义标引信息的音频资源给用户终端;
(3)、用户终端对接收到的带有语义标引信息的音频资源进行语义解析,并对解析出的语义标引信息进行一个初步的过滤,以此判断是否将接收到的音频资源在本地储存;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南科技大学,未经西南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110083131.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建立业务的方法和节点
- 下一篇:基于线性分组码的编码方法及装置