[发明专利]语音标注质量评价方法、装置、设备及存储介质在审
申请号: | 202011570121.1 | 申请日: | 2020-12-26 |
公开(公告)号: | CN112700763A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 喻涛;吴思远;熊世富 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李晓光 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 标注 质量 评价 方法 装置 设备 存储 介质 | ||
1.一种语音标注质量评价方法,其特征在于,包括:
获取与目标语音对应的待标注的语音识别结果,所述待标注的语音识别结果通过对所述目标语音的语音识别结果进行文本片段替换得到,其中,替换后的文本片段是相对于所述目标语音的错误文本片段;
获取标注对象对所述待标注的语音识别结果进行文本标注处理得到的标注结果,所述文本标注处理为标注识别错误的文本的处理;
根据所述待标注的语音识别结果以及所述标注结果,确定所述标注对象对所述目标语音进行语音标注的标注质量。
2.根据权利要求1所述的方法,其特征在于,所述获取与目标语音对应的待标注的语音识别结果,包括:
从目标语音的语音识别结果中,确定出待替换文本;
从预设的文本库中选择与所述待替换文本相匹配的文本,作为目标文本;
将所述语音识别结果中的待替换文本替换为所述目标文本,得到待标注的语音识别结果。
3.根据权利要求2所述的方法,其特征在于,所述从目标语音的语音识别结果中,确定出待替换文本,包括:
对目标语音的语音识别结果进行分词处理,确定所述语音识别结果包含的各个分词;
至少根据所述各个分词的识别信息,从所述各个分词中选择分词作为待替换文本,其中,所述识别信息包括置信度信息、位置信息以及词性信息中的至少一种。
4.根据权利要求3所述的方法,其特征在于,所述至少根据所述各个分词的识别信息,从所述各个分词中选择分词作为待替换文本,包括:
分别将每个分词的识别信息输入预先训练的分类模型,确定对每个分词的分类结果,所述分类结果是表示分词能否被替换的分类结果;
其中,所述分类模型至少以词汇的识别信息为训练样本,以词汇能否被替换为样本标签,训练得到;
基于对每个分词的分类结果,从各个分词中选择分词作为待替换文本。
5.根据权利要求4所述的方法,其特征在于,所述基于对每个分词的分类结果,从各个分词中选择分词作为待替换文本,包括:
若所述语音识别结果包含的各个分词中,存在能够被替换的分词,则从能够被替换的分词中选择至少一个分词,作为待替换文本;
若所述语音识别结果包含的各个分词中,不存在能够被替换的分词,则将所述语音识别结果中的设定位置处的文本确定为待替换文本。
6.根据权利要求2所述的方法,其特征在于,所述从预设的文本库中选择与所述待替换文本相匹配的文本,作为目标文本,包括:
从预设的文本库中,筛选与所述待替换文本相同类型的文本,作为候选文本;
从各个候选文本中,选择一个目标候选文本,作为目标文本;
其中,所述目标候选文本对应的语音与所述待替换文本对应的语音的差异度大于设定差异阈值,和/或,将所述语音识别结果中的待替换文本替换为所述目标候选文本得到的文本,与所述语音识别结果的语法结构相同。
7.根据权利要求1所述的方法,其特征在于,所述文本标注处理为标记识别错误的文本的处理,或者为修改识别错误的文本的处理。
8.根据权利要求7所述的方法,其特征在于,当所述文本标注处理为修改识别错误的文本的处理时,所述根据所述待标注的语音识别结果以及所述标注结果,确定所述标注对象对所述目标语音进行语音标注的标注质量,包括:
通过将所述待标注的语音识别结果与所述标注结果进行比对,至少确定所述标注对象对所述待标注的语音识别结果中的目标文本的修改率;所述目标文本是对所述目标语音的语音识别结果进行文本片段替换时,被替换进所述语音识别结果的文本片段;
至少根据所述标注对象对所述待标注的语音识别结果中的目标文本的修改率,确定所述标注对象对所述目标语音进行语音标注的标注质量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011570121.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通风式双层幕墙系统
- 下一篇:一种外科伤口杀菌仪