[发明专利]建立音频检索索引的方法、装置及计算机设备在审
申请号: | 201811550607.1 | 申请日: | 2018-12-18 |
公开(公告)号: | CN109635151A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 郑勇;王辉 | 申请(专利权)人: | 深圳市沃特沃德股份有限公司 |
主分类号: | G06F16/61 | 分类号: | G06F16/61;G06F16/65 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
地址: | 518000 广东省深圳市南山区蛇口*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音段 音频检索 索引 目标音频 计算机设备 检索 语音 播放位置 关联保存 建立索引 分类 内包 | ||
本发明提出了一种建立音频检索索引的方法、装置及计算机设备,其中建立音频检索索引的方法包括:将目标音频分成若干个语音段,其中,每个所述语音段中仅包括一个人物的语音;确定各个语音段所对应的人物;根据各个语音段所对应的不同人物,对各个语音段进行分类;将分类后的语音段与目标音频进行关联保存,以在语音段和目标音频间建立索引关系,形成音频检索索引。在建立了音频检索索引之后,用户能够检索出音频内包含有某个特定人物的语音的所有语音段,以及精准确定检索出来的语音段在音频中的具体播放位置,便于用户对音频进行回看或整理。
技术领域
本发明涉及到索引建立领域,特别是涉及到一种建立音频检索索引的方法、装置及计算机设备。
背景技术
在现有的音频或者视频文件中,人们如果想要回看音频或者视频中的某一部分,一般都是采用快进或者快退,或者手动拉动进度条,以调整到自己想要回看的部分,这种回看方式只适合于纯粹观看或者只是偶尔回看的场景。当人们需要对音频或者视频中的某一个特定人物所说的话进行检索或者整理时,采用这种回看方式就费时费力,而且效率低下。因此,以上问题亟待解决。
发明内容
本发明的主要目的为提供一种建立音频检索索引的方法、装置及计算机设备,可以建立音频文件中的各个语音段与目标音频之间的索引关系。
本发明提出一种建立音频检索索引的方法,包括:
将目标音频分成若干个语音段;其中,每个语音段中仅包括一个人物的语音;
确定各个语音段所对应的人物;
根据各个语音段所对应的不同人物,对各个语音段进行分类;
将分类后的语音段与目标音频进行关联保存,以在语音段和目标音频之间建立索引关系,形成音频检索索引。
进一步地,将目标音频分成若干个语音段的步骤,包括:
识别目标音频中包含的所有原始语音段;
对每个原始语音段的起点和终点进行标记,形成若干个语音段。
进一步地,确定各个语音段所对应的人物的步骤,包括:
在各个语音段之间进行语音特征参数的互相对比;
对语音特征参数相同的语音段做同一分类标记。
进一步地,在在各个语音段之间进行语音特征参数的互相对比的步骤之前,包括:
提取每个语音段的语音特征参数。
进一步地,根据各个语音段所对应的不同人物,对各个语音段进行分类的步骤,包括:
根据分类标记,对各个语音段进行分类。
进一步地,在将分类后的语音段与目标音频进行关联保存,形成音频检索索引的步骤之前,还包括:
参照目标音频的原始播放时间,对每个语音段播放时间的信息进行记录;
根据记录的播放时间的信息,按照播放时间的先后顺序排列各个分类内的语音段。
进一步地,在将分类后的语音段与目标音频进行关联保存,以在语音段和目标音频间建立索引关系,形成音频检索索引的步骤之后,还包括:
将每个分类内中的每个语音段的语音识别为文字;
将文字与对应的语音段进行关联保存。
本发明还提出了一种建立音频检索索引的装置,包括:
分割模块,用于将目标音频分成若干个语音段;其中,每个语音段中仅包括一个人物的语音;
确定模块,用于确定各个语音段所对应的人物;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市沃特沃德股份有限公司,未经深圳市沃特沃德股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811550607.1/2.html,转载请声明来源钻瓜专利网。