[发明专利]一种音频处理方法、装置及终端有效
申请号: | 201510270567.5 | 申请日: | 2015-05-25 |
公开(公告)号: | CN104978961B | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 赵伟峰 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/06 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 处理 方法 装置 终端 | ||
本发明实施例提供一种音频处理方法、装置及终端,其中的方法可包括:获取目标音频文件对应的字幕文件,所述字幕文件由至少一个字符单句顺序组成;根据所述至少一个字符单句之间的相似度构建字幕特征序列,所述字幕特征序列包括至少一个字符特征元素;按照预设段落总数对所述字幕特征序列进行优化;根据优化后的所述字幕特征序列中的至少一个字符特征元素的数值确定段落变化时间;按照所述段落变化时间将所述目标音频文件划分为所述预设段落总数的段落。本发明可基于音频文件对应的字幕文件中的字符单句的相似性实现对目标音频文件的段落划分,提升分段处理效率,提升音频处理的智能性。
技术领域
本发明互联网技术领域,具体涉及音频处理技术领域,尤其涉及一种音频处理方法、装置及终端。
背景技术
随着互联网技术的发展,互联网音频库中收录了大量的诸如歌曲、歌曲片段等音频文件,关于互联网音频的应用也日渐增多,例如:K歌系统、听歌系统等等。许多音频文件的应用场景需要对音频文件进行段落划分,例如:K歌系统中要实现歌曲分段合唱时,通常需要对歌曲进行段落划分;再如:听歌系统中需要重点听取歌曲片段时,通常需要对歌曲进行段落划分;等等。目前,通常采用人工对音频文件进行段落划分,分段处理效率较低,无法满足用户对音频文件的使用需求,从而降低了音频处理的智能性。
发明内容
本发明实施例提供一种音频处理方法、装置及终端,可基于音频文件对应的字幕文件中的字符单句的相似性实现对目标音频文件的段落划分,提升分段处理效率,提升音频处理的智能性。
本发明实施例第一方面提供一种音频处理方法,可包括:
获取目标音频文件对应的字幕文件,所述字幕文件由至少一个字符单句顺序组成;
根据所述至少一个字符单句之间的相似度构建字幕特征序列,所述字幕特征序列包括至少一个字符特征元素;
按照预设段落总数对所述字幕特征序列进行优化;
根据优化后的所述字幕特征序列中的至少一个字符特征元素的数值确定段落变化时间;
按照所述段落变化时间将所述目标音频文件划分为所述预设段落总数的段落。
本发明实施例第二方面提供一种音频处理装置,可包括:
获取单元,用于获取目标音频文件对应的字幕文件,所述字幕文件由至少一个字符单句顺序组成;
构建单元,用于根据所述至少一个字符单句之间的相似度构建字幕特征序列,所述字幕特征序列包括至少一个字符特征元素;
优化单元,用于按照预设段落总数对所述字幕特征序列进行优化;
确定单元,用于根据优化后的所述字幕特征序列中的至少一个字符特征元素的数值确定段落变化时间;
分段单元,用于按照所述段落变化时间将所述目标音频文件划分为所述预设段落总数的段落。
本发明实施例第三方面提供一种终端,可包括上述第二方面提供的音频处理装置。
实施本发明实施例,具有如下有益效果:
本发明实施例中,可根据目标音频文件对应的字幕文件中的至少一个字符单句之间的相似度构建字幕特征序列,按照预设段落总数对所述字幕特征序列进行优化,并根据优化后的所述字幕特征序列中的至少一个字符特征元素的数值确定段落变化时间,然后按照所述段落变化时间将所述目标音频文件划分为所述预设段落总数的段落,该音频处理过程利用字幕段落之间的字符单句的相似性特点,基于字幕文件中的字符单句的相似性实现对目标音频文件的段落划分,可提升分段处理效率,提升音频处理的智能性。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510270567.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:磁盘装置以及记录数据的恢复方法
- 下一篇:电梯轿厢智能测速与数码显示装置