[发明专利]从音频文件中提取有声片段的方法、装置设备及存储介质有效
申请号: | 201911206708.1 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110910863B | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 张天祥;范磊;杨丽涛 | 申请(专利权)人: | 上海依图信息技术有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L25/78 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 徐红银 |
地址: | 200126 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频文件 提取 有声 片段 方法 装置 设备 存储 介质 | ||
1.一种从音频文件中提取有声片段的方法,其特征在于,包括:
获取待处理音频文件;
对所述待处理音频文件进行分割,得到多个音频片段;
对每个所述音频片段进行语音识别,得到语音识别结果,所述语音识别结果包括以字为单位的文本以及每个字在所述音频文件中的偏移位置;
基于所述音频文件的语音识别结果中是否存在文本判断音频片段是否有声,并在有声时,根据该文本中的首字的偏移位置,记录有声片段的开始位置,并继续遍历所述文本,直至出现一个不存在文本的音频片段,以上一个音频片段中的文本中最后一个字所对应的偏移位置作为该有声片段的结束位置,提取所述有声片段;
针对两个相邻的有声片段,当前一有声片段的语音识别结果中的文本的尾字所对应的偏移位置与后一有声片段的语音识别结果中的文本的首字所对应的偏移位置之差小于预定阈值时,将该两段有声片段进行合并输出。
2.根据权利要求1所述的方法,其特征在于,在得到多个音频片段后攒批进行所述语音识别处理,得到各个批次的所述语音识别结果。
3.根据权利要求2所述的方法,其特征在于,对于各个批次的所述语音识别进行排序合并,得到排序后的完整的所述语音识别结果。
4.根据权利要求3所述的方法,其特征在于,还包括:
从头开始遍历所述语音识别结果,并基于所述语音识别结果是否存在文本判断当前音频片段是否有声;
当所述语音识别结果中存在文本时,判断为当前的音频片段有声;
根据该文本中的首字的偏移位置,记录有声片段的开始位置;
继续遍历所述文本,直至出现一个不存在文本的音频片段,以上一个音频片段中的文本中最后一个字所对应的偏移位置作为该有声片段的结束位置;
重复上述步骤,直至针对所述语音识别结果均已判断完毕,得到所有所述有声片段并提取。
5.一种从音频文件中提取有声片段的装置,其特征在于,包括:
获取模块,用于获取待处理音频文件;
切分模块,用于对所述待处理音频文件进行分割,得到多个音频片段;
语音识别模块,用于对每个所述音频片段进行语音识别,得到语音识别结果,所述语音识别结果包括以字为单位的文本以及每个字在所述音频文件中的偏移位置;
提取模块,基于所述语音识别结果中是否存在文本判断音频片段是否有声,并在有声时,根据该文本中的首字的偏移位置,记录有声片段的开始位置继续遍历所述文本,直至出现一个不存在文本的所述音频片段,以上一个所述音频片段中的文本中最后一个字所对应的偏移位置作为该所述有声片段的结束位置,提取所述有声片段,以及针对两个相邻的有声片段,当前一有声片段的语音识别结果中的文本的尾字所对应的偏移位置与后一有声片段的语音识别结果中的文本的首字所对应的偏移位置之差小于预定阈值时,将该两段有声片段进行合并输出。
6.根据权利要求5所述的装置,其特征在于,所述语音识别模块具体用于:在得到多个音频片段后攒批进行所述语音识别处理,得到各个批次的所述语音识别结果。
7.根据权利要求6所述的装置,其特征在于,所述语音识别模块具体用于:对于各个批次的所述语音识别进行排序合并,得到排序后的完整的所述语音识别结果。
8.根据权利要求7所述的装置,其特征在于,所述提取模块具体用于:
从头开始遍历所述语音识别结果,并基于所述语音识别结果是否存在文本判断当前音频片段是否有声;
当所述语音识别结果中存在文本时判断为当前的音频片段有声;
根据该文本中的首字的偏移位置,记录有声片段的开始位置;
继续遍历所述文本,直至出现一个不存在文本的音频片段,以上一个音频片段中的文本中最后一个字所对应的偏移位置作为该有声片段的结束位置;
重复上述步骤,直至针对所述语音识别结果均已判断完毕,得到所有所述有声片段并提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图信息技术有限公司,未经上海依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911206708.1/1.html,转载请声明来源钻瓜专利网。