[发明专利]音频质量识别模型的训练方法、装置、服务器和存储介质在审
申请号: | 202010750778.X | 申请日: | 2020-07-30 |
公开(公告)号: | CN111863033A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 郑羲光;张晨 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L15/06 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 冯右明 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 质量 识别 模型 训练 方法 装置 服务器 存储 介质 | ||
本公开关于一种音频质量识别模型的训练方法、装置、服务器和存储介质,该方法包括:获取音频样本数据集合;获取每个音频信号的特征信息和音频信号对应的目标音频质量信息;将获取的特征信息输入待训练的音频质量识别模型中,得到待训练的音频质量识别模型输出的音频质量信息;根据待训练的音频质量识别模型输出的音频质量信息和目标音频质量信息,获取待训练的音频质量识别模型的损失值;根据损失值调整待训练的音频质量识别模型的模型参数,直至损失值低于预设阈值时,将待训练的音频质量识别模型作为训练好的音频质量识别模型。采用本方法,可以通过训练好的音频质量识别模型直接输出音频信号的音频质量,从而提高了音频质量的检测效率。
技术领域
本公开涉及音频处理技术领域,尤其涉及一种音频质量识别模型的训练方法、装置、服务器和存储介质。
背景技术
随着多媒体技术的发展,越来越多的音频应用到短视频中,识别音频的音质好坏显得越来越重要,比如内容生产者在生产短视频时可对音频进行检测,并给予相应提示;在内容推荐端,音质好坏可以作为推荐的一个因素之一;然而,为了识别音频的音质好坏,需要对音频的质量进行检测。
相关技术中,对音频质量的检测方法,一般是获取待检测音频信号的原始无损音频信号,并对比原始无损音频信号和待检测音频信号之间的差距值,然后根据差距值的大小来确定待检测音频信号的质量;但是,每次对音频信号的质量进行检测时,都需要获取对应的原始无损音频信号,且实际使用中大部分场景无法获得原始无损音频信号,导致音频质量的检测效率较低。
发明内容
本公开提供一种音频质量识别模型的训练方法、装置、服务器和存储介质,以至少解决相关技术中音频质量的检测效率较低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种音频质量识别模型的训练方法,包括:
获取音频样本数据集合;所述音频样本数据集合中包括不同编码格式的音频信号;
获取每个所述音频信号的特征信息和所述音频信号对应的目标音频质量信息;所述目标音频质量信息与所述音频信号的编码格式和编码码率相关联,用于标识所述音频信号的音频质量;
将获取的所述特征信息输入待训练的音频质量识别模型中,得到所述待训练的音频质量识别模型输出的音频质量信息;
根据所述待训练的音频质量识别模型输出的音频质量信息和目标音频质量信息,获取所述待训练的音频质量识别模型的损失值;
根据所述损失值调整所述待训练的音频质量识别模型的模型参数,直至所述损失值低于预设阈值时,将所述待训练的音频质量识别模型作为训练好的音频质量识别模型。
在一示例性实施例中,在获取每个所述音频信号的特征信息和所述音频信号对应的目标音频质量信息之前,还包括:
根据目标编码码率对所述音频信号进行转码处理,得到转码处理后的音频信号;所述目标编码码率高于所述音频信号的所述编码码率;
所述获取每个所述音频信号的特征信息,包括:
获取每个所述转码处理后的音频信号的特征信息。
在一示例性实施例中,所述获取每个所述音频信号的特征信息和所述音频信号对应的目标音频质量信息,包括:
获取所述音频信号的编码码率;
根据所述音频信号的编码码率和编码格式,查询预设的音频质量信息匹配表,得到与所述编码码率和所述编码格式相关联的目标音频质量信息,作为所述音频信号对应的目标音频质量信息;所述预设的音频质量信息匹配表记录有在同一个所述编码格式下,不同目标编码码率对应的目标音频质量信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010750778.X/2.html,转载请声明来源钻瓜专利网。