[发明专利]一种控制音频与文本同步的方法及装置有效
申请号: | 201811151871.8 | 申请日: | 2018-09-29 |
公开(公告)号: | CN109275009B | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 李全;孔常青;王玮;苏文畅 | 申请(专利权)人: | 安徽听见科技有限公司 |
主分类号: | H04N21/43 | 分类号: | H04N21/43;G10L15/26 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 控制 音频 文本 同步 方法 装置 | ||
本发明实施例提供一种控制音频与文本同步的方法及装置,其中方法包括:获取目标音频和由所述目标音频转换得到的识别文本;接收对所述识别文本的编辑操作,得到所述识别文本的编辑后文本;根据所述识别文本和所述编辑后文本,确定目标文本;控制所述目标文本与所述目标音频进行同步。本发明实施例实现了识别文本的编辑过程中目标文本与目标音频的重新同步过程。
技术领域
本发明涉及语音技术领域,尤其涉及一种控制音频与文本同步的方法及装置。
背景技术
随着互联网应用的普及,越来越多的场景下需要实时编辑音频对应的文字,例如编辑视频字幕或是整理时间轴准确度要求高的会议记录。但是由于音频和由音频识别得到的文字是对齐的,这就导致若是对识别得到的文字进行编辑,则编辑后的文字与原有音频之间的不对齐,从而对一些例如需要回放显示音频和音频对应文字等的场景带来不便利性。
发明内容
本发明实施例提供一种控制音频与文本同步的方法及装置,以解决现有技术中存在的在对音频的识别文本进行编辑后,不能将编辑后的文本与音频进行重新对齐的问题。
针对上述问题,第一方面,本发明实施例提供一种控制音频与文本同步的方法,所述方法包括:
获取目标音频和由所述目标音频转换得到的识别文本;
接收对所述识别文本的编辑操作,得到所述识别文本的编辑后文本;
根据所述识别文本和所述编辑后文本,确定目标文本;
控制所述目标文本与所述目标音频进行同步。
第二方面,本发明实施例提供一种控制音频与文本同步的装置,所述装置包括:
第一获取模块,用于获取目标音频和由所述目标音频转换得到的识别文本;
第二获取模块,用于接收对所述识别文本的编辑操作,得到所述识别文本的编辑后文本;
确定模块,用于根据所述识别文本和所述编辑后文本,确定目标文本;
控制模块,用于控制所述目标文本与所述目标音频进行同步。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的控制音频与文本同步的方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的控制音频与文本同步的方法的步骤。
本发明实施例提供的控制音频与文本同步的方法及装置,通过在接收对目标音频转换得到的识别文本的编辑操作时,得到该识别文本的编辑后文本,并根据识别文本和编辑后文本,确定用于与目标音频进行同步的目标文本,然后控制该目标文本与目标音频进行同步,避免了由于用户编辑错误而导致的编辑后文本与音频不同,进而导致不能准确的音频同步的问题,实现了在对识别文本的编辑过程中,能够直接将通过识别文本和编辑后文本得到的目标文本与目标音频进行重新同步,从而实现了识别文本的编辑过程中目标文本与目标音频的实时同步过程。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1表示本发明实施例中控制音频与文本同步的方法的步骤流程图;
图2表示本发明实施例中根据识别文本和编辑后文本,确定目标文本时的步骤流程图;
图3表示图2中步骤202之后的控制音频与文本同步的方法的步骤流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽听见科技有限公司,未经安徽听见科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811151871.8/2.html,转载请声明来源钻瓜专利网。