[发明专利]语音标注质量评价方法、装置、设备及存储介质在审
申请号: | 202011570121.1 | 申请日: | 2020-12-26 |
公开(公告)号: | CN112700763A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 喻涛;吴思远;熊世富 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李晓光 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 标注 质量 评价 方法 装置 设备 存储 介质 | ||
本申请提出一种语音标注质量评价方法、装置、设备及存储介质,该方法包括:获取与目标语音对应的待标注的语音识别结果,所述待标注的语音识别结果通过对所述目标语音的语音识别结果进行文本片段替换得到,其中,替换后的文本片段是相对于所述目标语音的错误文本片段;获取标注对象对所述待标注的语音识别结果进行文本标注处理得到的标注结果,所述文本标注处理为标注识别错误的文本的处理;根据所述待标注的语音识别结果以及所述标注结果,确定所述标注对象对所述目标语音进行语音标注的标注质量。上述过程实现了对标注对象的语音标注质量的自动评价,实现了对标注对象的语音标注工作的监督,利于提升标注对象语音标注质量。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种语音标注质量评价方法、装置、设备及存储介质。
背景技术
有监督训练是语音识别模型训练中常用的训练方式,该有监督训练需要大量的具有文本标注的语音数据作为训练样本。常规的有监督训练样本获取方法是,通过人工或机器,对语音数据进行文本标注得到训练样本。
其中,对语音数据的标注质量,直接影响语音数据的文本标注的准确性,进而影响对模型的训练效果。因此需要对语音数据的标注质量进行评价,从而对标注对象的标注工作进行监督。
发明内容
基于上述需求,本申请提出一种语音标注质量评价方法、装置、设备及存储介质,能够用于对标注对象的语音标注质量进行自动评价。
本申请提出的技术方案具体如下:
一种语音标注质量评价方法,包括:
获取与目标语音对应的待标注的语音识别结果,所述待标注的语音识别结果通过对所述目标语音的语音识别结果进行文本片段替换得到,其中,替换后的文本片段是相对于所述目标语音的错误文本片段;
获取标注对象对所述待标注的语音识别结果进行文本标注处理得到的标注结果,所述文本标注处理为标注识别错误的文本的处理;
根据所述待标注的语音识别结果以及所述标注结果,确定所述标注对象对所述目标语音进行语音标注的标注质量。
可选的,所述获取与目标语音对应的待标注的语音识别结果,包括:
从目标语音的语音识别结果中,确定出待替换文本;
从预设的文本库中选择与所述待替换文本相匹配的文本,作为目标文本;
将所述语音识别结果中的待替换文本替换为所述目标文本,得到待标注的语音识别结果。
可选的,所述从目标语音的语音识别结果中,确定出待替换文本,包括:
对目标语音的语音识别结果进行分词处理,确定所述语音识别结果包含的各个分词;
至少根据所述各个分词的识别信息,从所述各个分词中选择分词作为待替换文本,其中,所述识别信息包括置信度信息、位置信息以及词性信息中的至少一种。
可选的,所述至少根据所述各个分词的识别信息,从所述各个分词中选择分词作为待替换文本,包括:
分别将每个分词的识别信息输入预先训练的分类模型,确定对每个分词的分类结果,所述分类结果是表示分词能否被替换的分类结果;
其中,所述分类模型至少以词汇的识别信息为训练样本,以词汇能否被替换为样本标签,训练得到;
基于对每个分词的分类结果,从各个分词中选择分词作为待替换文本。
可选的,所述基于对每个分词的分类结果,从各个分词中选择分词作为待替换文本,包括:
若所述语音识别结果包含的各个分词中,存在能够被替换的分词,则从能够被替换的分词中选择至少一个分词,作为待替换文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011570121.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通风式双层幕墙系统
- 下一篇:一种外科伤口杀菌仪