[发明专利]一种语音标注方法及装置有效

申请号：	201910867063.X	申请日：	2019-09-12
公开（公告）号：	CN110610698B	公开（公告）日：	2022-09-27
发明（设计）人：	汪俊;闫博群;李索恒;张志齐	申请（专利权）人：	上海依图信息技术有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/08;G10L15/26
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	王娜
地址：	201125 上海市***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音标注方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实时例提供一种语音标注方法及装置，涉及信息技术领域，所述方法包括：获取待标注语音信息；将所述待标注语音信息输入至语音识别模型中，得到语音识别结果，所述语音识别结果中至少包括候选标注结果，所述候选识别结果是所述语音识别模型针对同一待标注语音子信息确定的多个识别结果，所述待标注语音子信息为所述待标注语音信息的部分或全部；针对所述候选标注结果，接收标注人员确定的第二标注结果；根据所述第二标注结果，确定所述待标注语音信息的标注结果。使用了人机交互的方式提高了标注过程的效率。

技术领域

本发明实施例信息技术领域，尤其涉及一种语音标注方法及装置。

背景技术

随着通信技术的发展，智能终端的普及，各种网络通讯工具成为大众沟通的主要工具之一。其中由于语音信息的操作和传输的便捷性，成为各种网络通讯工具的主要传输信息。而在使用各种网络通讯工具时，还涉及到将语音信息进行文本转换的过程，该过程就是语音识别技术。

语音识别技术中通常需要训练语音识别模型，在训练语音识别模型时，需要对海量语音数据进行标注。但是现有技术中通常采用人工进行标注，致使语音数据标注的工作效率低下，错误率高。

发明内容

本发明实施例提供一种语音标注方法及装置，能够提高语音标注过程的效率，并提高语音标注的准确性。

一方面，本发明实施例提供一种语音标注方法，所述方法包括：

获取待标注语音信息；

将所述待标注语音信息输入至语音识别模型中，得到语音识别结果，所述语音识别结果中至少包括候选标注结果，所述候选识别结果是所述语音识别模型针对同一待标注语音子信息确定的多个识别结果，所述待标注语音子信息为所述待标注语音信息的部分或全部；

针对所述候选标注结果，接收标注人员确定的第二标注结果；

根据所述第二标注结果，确定所述待标注语音信息的标注结果。