[发明专利]一种音频文字校对的方法和系统在审
申请号: | 201810334974.1 | 申请日: | 2018-04-15 |
公开(公告)号: | CN110390930A | 公开(公告)日: | 2019-10-29 |
发明(设计)人: | 高翔 | 申请(专利权)人: | 高翔 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100013 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 校对 子文件 音频文字 文字文件 音频文件 终端 发起终端 工作效率 有效地 转写 并发 合并 展示 保证 | ||
本发明的实施例提供了一种音频文字校对的方法和系统,该方法包括发起终端将音频文件发送给校对平台;校对平台将音频文件转写成文字文件;校对平台将音频文件和文字文件对应拆分成不少于1个的音频子文件和文字子文件;校对平台将音频子文件和对应的文字子文件发送给校对终端;校对终端展示音频子文件和对应的文字子文件,并根据音频子文件调整对应的文字子文件,生成校对后文字子文件;校对终端将校对后文字子文件发送给校对平台;校对平台将不同校对终端发来的校对后文字子文件进行合并,形成校对后的文字文件,并发送给发起终端。采用了本发明的技术方案,能够有效地提高音频文字校对的工作效率,而且可以保证音频文字校对的质量。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种音频文字校对的方法和系统。
背景技术
随着语音识别技术的发展,能够非常方便地将音频文件转换成文字。相对于音频文件,文字文件不仅占用的存储空间较小,易于保存,而且在有些特殊场合必须将音频文件转换成文字,形成书面文件。
然而在将音频文件转换成文字的过程中,经常会出现转换错误,比如音频文件中吐字不清、或者同音字词等原因,导致文字与音频不能对应。而在许多行业,例如教学、培训、法律等行业,需要文字与音频做到完全对应,因此需要在音频文件转换成文字后,再根据音频对文字进行校对。
目前,音频文字校对是通过一边播放音频,一边检查文字来完成的,这样校对的时间至少与音频的播放时间相等,甚至更长,而且如果音频转写文字受到方言或者语种的限制,还需要寻找特定的人员完成校对,这些都导致音频文字校对的工作效率很低。
发明内容
鉴于上述技术问题,本发明实施例提供一种音频文字校对的方法和系统,能够有效地提高音频文字校对的工作效率,而且可以保证音频文字校对的质量。
本发明的实施例一方面提供了一种音频文字校对的方法,包括以下步骤:
发起终端将音频文件发送给校对平台;
所述校对平台将所述音频文件转写成文字文件;
所述校对平台将所述音频文件和所述文字文件对应拆分成不少于1个的音频子文件和文字子文件;
所述校对平台将所述音频子文件和对应的文字子文件发送给校对终端;
所述校对终端展示所述音频子文件和对应的文字子文件,并根据所述音频子文件调整对应的文字子文件,生成校对后文字子文件;
所述校对终端将所述校对后文字子文件发送给所述校对平台;
所述校对平台将不同校对终端发来的校对后文字子文件进行合并,形成校对后的文字文件,并发送给所述发起终端。
进一步地,还包括以下步骤:
所述发起终端向所述校对平台发送校对要求信息,所述校对要求包括选择校对终端、转写文字文件的语种、文字文件展示方式、反馈时间和/或保密。
进一步地,还包括以下步骤:
所述发起终端通过所述校对平台查阅校对进度;
所述发起终端向所述校对平台发送放弃校对或者重新选择校对终端的指令,所述校对平台根据指令放弃校对或者重新选择校对终端;
或者所述发起终端对不同的校对终端进行评价。
进一步地,还包括以下步骤:
所述校对平台对所述发起终端发来的音频文件进行质量检测,判断能否转写或者校对。
进一步地,所述校对平台对所述音频文件和所述文字文件对应拆分成不少于1个的音频子文件和文字子文件,进一步包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高翔,未经高翔许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810334974.1/2.html,转载请声明来源钻瓜专利网。