[发明专利]一种针对音频的评测方法及装置有效
申请号: | 201910423218.0 | 申请日: | 2019-05-21 |
公开(公告)号: | CN109979482B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 江勇军;吴奎;朱群;杨康;竺博;潘嘉;魏思;王智国 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/30;G10L25/51 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杨华;王宝筠 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 音频 评测 方法 装置 | ||
本发明提供了一种针对音频的评测方法及装置,依据音频和音频的文本,计算得到评测特征,并获取音频中的局部音频的目标局部特征,最后依据评测特征确定的整体评测结果和依据目标局部特征确定的局部评测结果,得到音频的评测结果。所以本申请提供的方法及装置,不仅将整个音频的特征作为评测依据,还将局部音频的特征也作为评测依据,因此,从多个维度对音频进行精细的评测,从而提高了评测的准确性。
技术领域
本发明涉及电子信息技术领域,特别涉及一种针对音频的评测方法及装置。
背景技术
随着科技的发展,手写答题卡的自动评分技术已经得到普及,但除了以答题卡为测试媒介以外,音频也常被作为测试媒介,因此,也需要对音频进行自动评分,例如口语考试中的朗读测评,要求考生按照测试文本进行朗读,然后针对考生朗读的音频进行评分。
现有的音频自动评分技术一般为智能语音测评技术,该技术基于深度学习算法实现对音频进行自动打分。该技术在一定程度上虽然可以降低人工评分的成本,但多次试验效果表明,现有的音频自动评分技术的评分结果与人工评分相差较大,评分结果不准确。
发明内容
申请人在研究的过程中发现,现有的基于深度学习算法的音频自动评分技术都是只对整体音频进行建模,而实际上,通常在整段音频中有被测者读得好的部分,也有被测者读得差的部分,因此仅用一个模型对整段音频进行评分,得到的评分结果不准确。
有鉴于此,本发明提供了一种针对音频的评测方法及装置,目的在于解决如何提高针对音频的评测结果的准确性的问题。
为实现上述目的,本发明提供如下技术方案:
一种针对音频的评测方法,包括:
依据所述音频和所述音频的文本,计算得到评测特征;
获取目标局部特征,所述目标局部特征为依据所述音频中的局部音频确定的特征;
依据整体评测结果和局部评测结果,确定所述音频的评测结果,其中,所述整体评测结果由所述评测特征确定,所述局部评测结果由所述目标局部特征确定。
可选的,所述局部音频为所述音频中具有正向评测特征的音频段和/或具有负向评测特征的音频段。
可选的,所述依据所述音频和所述音频的文本,计算得到评测特征,包括:
依据所述音频的声学特征,计算声学隐层特征;
依据所述声学特征和所述音频的文本,计算音素嵌入特征;
依据所述声学特征、所述声学隐层特征和所述音素嵌入特征,确定所述评测特征。
可选的,所述获取目标局部特征,包括:
获取所述局部音频的标识;
从所述评测特征中获取与所述局部音频的标识对应的特征,作为所述目标局部特征,其中,所述音频中的各个音频帧的所述评测特征与所述音频的各个标识唯一对应。
可选的,所述获取所述局部音频的标识,包括:
定位所述音频中的所述局部音频;
提取所述局部音频的标识。
可选的,由所述评测特征确定所述整体评测结果,包括:
确定每个音频帧的所述评测特征对应的音素;
将对应音素相同的评测特征进行平均计算,得到各个音素的评测特征;
将各个音素的评测特征输入整体评测器,得到每个音素的整体评测结果;
依据所述每个音素的整体评测结果,计算得到所述音频的所述整体评测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910423218.0/2.html,转载请声明来源钻瓜专利网。