[发明专利]建立音频检索索引的方法、装置及计算机设备在审

申请号：	201811550607.1	申请日：	2018-12-18
公开（公告）号：	CN109635151A	公开（公告）日：	2019-04-16
发明（设计）人：	郑勇;王辉	申请（专利权）人：	深圳市沃特沃德股份有限公司
主分类号：	G06F16/61	分类号：	G06F16/61;G06F16/65
代理公司：	深圳市明日今典知识产权代理事务所(普通合伙) 44343	代理人：	王杰辉
地址：	518000 广东省深圳市南山区蛇口***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音段音频检索索引目标音频计算机设备检索语音播放位置关联保存建立索引分类内包
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出了一种建立音频检索索引的方法、装置及计算机设备，其中建立音频检索索引的方法包括：将目标音频分成若干个语音段，其中，每个所述语音段中仅包括一个人物的语音；确定各个语音段所对应的人物；根据各个语音段所对应的不同人物，对各个语音段进行分类；将分类后的语音段与目标音频进行关联保存，以在语音段和目标音频间建立索引关系，形成音频检索索引。在建立了音频检索索引之后，用户能够检索出音频内包含有某个特定人物的语音的所有语音段，以及精准确定检索出来的语音段在音频中的具体播放位置，便于用户对音频进行回看或整理。

技术领域

本发明涉及到索引建立领域，特别是涉及到一种建立音频检索索引的方法、装置及计算机设备。

背景技术

在现有的音频或者视频文件中，人们如果想要回看音频或者视频中的某一部分，一般都是采用快进或者快退，或者手动拉动进度条，以调整到自己想要回看的部分，这种回看方式只适合于纯粹观看或者只是偶尔回看的场景。当人们需要对音频或者视频中的某一个特定人物所说的话进行检索或者整理时，采用这种回看方式就费时费力，而且效率低下。因此，以上问题亟待解决。

发明内容

本发明的主要目的为提供一种建立音频检索索引的方法、装置及计算机设备，可以建立音频文件中的各个语音段与目标音频之间的索引关系。

本发明提出一种建立音频检索索引的方法，包括：

将目标音频分成若干个语音段；其中，每个语音段中仅包括一个人物的语音；

确定各个语音段所对应的人物；

根据各个语音段所对应的不同人物，对各个语音段进行分类；

将分类后的语音段与目标音频进行关联保存，以在语音段和目标音频之间建立索引关系，形成音频检索索引。

进一步地，将目标音频分成若干个语音段的步骤，包括：

识别目标音频中包含的所有原始语音段；

对每个原始语音段的起点和终点进行标记，形成若干个语音段。

进一步地，确定各个语音段所对应的人物的步骤，包括：

在各个语音段之间进行语音特征参数的互相对比；