[发明专利]一种语音标注方法及装置有效
申请号: | 201910867063.X | 申请日: | 2019-09-12 |
公开(公告)号: | CN110610698B | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 汪俊;闫博群;李索恒;张志齐 | 申请(专利权)人: | 上海依图信息技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/08;G10L15/26 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 王娜 |
地址: | 201125 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 标注 方法 装置 | ||
1.一种语音标注方法,其特征在于,所述方法包括:
获取待标注语音信息;
将所述待标注语音信息的各待标注语音子信息输入至语音识别模型中的各语音识别子模型中,各语音识别子模型针对所述待标注语音子信息进行识别,得到各语音识别子模型识别相同的结果以及各语音识别子模型识别不同的结果,其中将各语音识别子模型识别不同的结果作为候选标注结果,所述候选标注结果是所述语音识别模型针对同一待标注语音子信息确定的多个识别结果,所述待标注语音子信息为所述待标注语音信息的部分或全部;
针对所述候选标注结果,接收标注人员确定的第二标注结果;
根据各语音识别子模型识别相同的结果以及所述第二标注结果确定所述待标注语音信息的标注结果。
2.根据权利要求1所述的方法,其特征在于,所述接收标注人员确定的第二标注结果,包括:
将与所述候选标注结果对应的待标注语音子信息进行播放;
接收所述标注人员根据播放的所述待标注语音子信息确定的所述第二标注结果。
3.根据权利要求1所述的方法,其特征在于,所述根据各语音识别子模型识别相同的结果以及所述第二标注结果确定所述待标注语音信息的标注结果后,还包括:
根据所述待标注语音信息的标注结果训练所述语音识别模型。
4.一种语音标注装置,其特征在于,所述装置包括:
获取单元,用于获取待标注语音信息;
识别单元,用于将所述待标注语音信息的各待标注语音子信息输入至语音识别模型中的各语音识别子模型中,各语音识别子模型针对所述待标注语音子信息进行识别,得到各语音识别子模型识别相同的结果以及各语音识别子模型识别不同的结果,其中将各语音识别子模型识别不同的结果作为候选标注结果,所述候选标注结果是所述语音识别模型针对同一待标注语音子信息确定的多个识别结果,所述待标注语音子信息为所述待标注语音信息的部分或全部;
接收单元,用于针对所述候选标注结果,接收标注人员确定的第二标注结果;
确定单元,用于根据各语音识别子模型识别相同的结果以及所述第二标注结果确定所述待标注语音信息的标注结果。
5.根据权利要求4所述的装置,其特征在于,所述接收单元具体用于:
将与所述候选标注结果对应的待标注语音子信息进行播放;
接收所述标注人员根据播放的所述待标注语音子信息确定的所述第二标注结果。
6.根据权利要求4所述的装置,其特征在于,所述装置还包括:
训练单元,用于根据所述待标注语音信息的标注结果训练所述语音识别模型。
7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1~3任一权利要求所述方法的步骤。
8.一种计算机可读存储介质,其特征在于,其存储有可由计算机设备执行的计算机程序,当所述程序在计算机设备上运行时,使得所述计算机设备执行权利要求1~3任一所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图信息技术有限公司,未经上海依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910867063.X/1.html,转载请声明来源钻瓜专利网。