[发明专利]一种语音标注方法及装置有效
申请号: | 201910867063.X | 申请日: | 2019-09-12 |
公开(公告)号: | CN110610698B | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 汪俊;闫博群;李索恒;张志齐 | 申请(专利权)人: | 上海依图信息技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/08;G10L15/26 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 王娜 |
地址: | 201125 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 标注 方法 装置 | ||
本发明实时例提供一种语音标注方法及装置,涉及信息技术领域,所述方法包括:获取待标注语音信息;将所述待标注语音信息输入至语音识别模型中,得到语音识别结果,所述语音识别结果中至少包括候选标注结果,所述候选识别结果是所述语音识别模型针对同一待标注语音子信息确定的多个识别结果,所述待标注语音子信息为所述待标注语音信息的部分或全部;针对所述候选标注结果,接收标注人员确定的第二标注结果;根据所述第二标注结果,确定所述待标注语音信息的标注结果。使用了人机交互的方式提高了标注过程的效率。
技术领域
本发明实施例信息技术领域,尤其涉及一种语音标注方法及装置。
背景技术
随着通信技术的发展,智能终端的普及,各种网络通讯工具成为大众沟通的主要工具之一。其中由于语音信息的操作和传输的便捷性,成为各种网络通讯工具的主要传输信息。而在使用各种网络通讯工具时,还涉及到将语音信息进行文本转换的过程,该过程就是语音识别技术。
语音识别技术中通常需要训练语音识别模型,在训练语音识别模型时,需要对海量语音数据进行标注。但是现有技术中通常采用人工进行标注,致使语音数据标注的工作效率低下,错误率高。
发明内容
本发明实施例提供一种语音标注方法及装置,能够提高语音标注过程的效率,并提高语音标注的准确性。
一方面,本发明实施例提供一种语音标注方法,所述方法包括:
获取待标注语音信息;
将所述待标注语音信息输入至语音识别模型中,得到语音识别结果,所述语音识别结果中至少包括候选标注结果,所述候选识别结果是所述语音识别模型针对同一待标注语音子信息确定的多个识别结果,所述待标注语音子信息为所述待标注语音信息的部分或全部;
针对所述候选标注结果,接收标注人员确定的第二标注结果;
根据所述第二标注结果,确定所述待标注语音信息的标注结果。
可选的,所述接收标注人员确定的第二标注结果,包括:
将与所述候选标注结果对应的待标注语音子信息进行播放;
接收所述标注人员根据播放的所述待标注语音子信息确定的所述第二标注信息。
可选的,所述将所述待标注语音信息输入至语音识别模型中,得到语音识别结果,包括:
将所述待标注语音信息的各待标注语音子信息输入至语音识别模型中的各语音识别子模型中,各语音识别子模型针对所述待标注语音子信息进行识别,得到各语音识别子模型识别相同的结果以及各语音识别子模型识别不同的结果,其中将各语音识别子模型识别不同的结果作为所述候选标注结果。
可选的,所述根据所述第二标注结果,确定所述待标注语音信息的标注结果,包括:
根据各语音识别子模型识别相同的结果以及所述第二标注结果确定所述待标注语音信息的标注结果。
可选的,所述根据所述第二标注结果,确定所述待标注语音信息的标注结果后,还包括:
根据所述待标注语音信息的标注结果训练所述语音识别模型。
一方面,本发明实施例还提供一种语音标注装置,所述装置包括:
获取单元,用于获取待标注语音信息;
识别单元,用于将所述待标注语音信息输入至语音识别模型中,得到语音识别结果,所述语音识别结果中至少包括候选标注结果,所述候选识别结果是所述语音识别模型针对同一待标注语音子信息确定的多个识别结果,所述待标注语音子信息为所述待标注语音信息的部分或全部;
接收单元,用于针对所述候选标注结果,接收标注人员确定的第二标注结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图信息技术有限公司,未经上海依图信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910867063.X/2.html,转载请声明来源钻瓜专利网。