[发明专利]一种音频处理方法、装置及终端有效
申请号: | 201510270567.5 | 申请日: | 2015-05-25 |
公开(公告)号: | CN104978961B | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 赵伟峰 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/06 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种音频处理方法、装置及终端,其中的方法可包括:获取目标音频文件对应的字幕文件,所述字幕文件由至少一个字符单句顺序组成;根据所述至少一个字符单句之间的相似度构建字幕特征序列,所述字幕特征序列包括至少一个字符特征元素;按照预设段落总数对所述字幕特征序列进行优化;根据优化后的所述字幕特征序列中的至少一个字符特征元素的数值确定段落变化时间;按照所述段落变化时间将所述目标音频文件划分为所述预设段落总数的段落。本发明可基于音频文件对应的字幕文件中的字符单句的相似性实现对目标音频文件的段落划分,提升分段处理效率,提升音频处理的智能性。 | ||
搜索关键词: | 一种 音频 处理 方法 装置 终端 | ||
【主权项】:
1.一种音频处理方法,其特征在于,包括:获取目标音频文件对应的字幕文件,所述字幕文件由至少一个字符单句顺序组成;根据所述至少一个字符单句的数量确定构建字幕特征序列的字符特征元素的数量;根据所述至少一个字符单句中各字符单句的顺序,确定构建所述字幕特征序列的各字符特征元素的索引;将构建所述字幕特征序列的各字符特征元素的数值均设置为初始值;针对所述至少一个字符单句中的任一个目标字符单句,若所述目标字符单句与所述目标字符单句的在后字符单句之间的最大相似度大于预设相似阀值,将所述目标字符单句对应的字符特征元素的数值从初始值变更为目标值;按照构建所述字幕特征序列的字符特征元素的数量、索引及数值,构建所述字幕特征序列,所述字幕特征序列包括至少一个字符特征元素;按照预设段落总数对所述字幕特征序列进行优化;根据优化后的所述字幕特征序列中的至少一个字符特征元素的数值确定段落变化时间;按照所述段落变化时间将所述目标音频文件划分为所述预设段落总数的段落。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510270567.5/,转载请声明来源钻瓜专利网。
- 上一篇:磁盘装置以及记录数据的恢复方法
- 下一篇:电梯轿厢智能测速与数码显示装置