[发明专利]音频处理方法、装置、电子设备及存储介质在审
申请号: | 201911398886.9 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111063327A | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 马丹 | 申请(专利权)人: | 咪咕文化科技有限公司;中国移动通信集团有限公司 |
主分类号: | G10H1/00 | 分类号: | G10H1/00;G10L25/51;G10L25/03 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王宇杨 |
地址: | 100032*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 电子设备 存储 介质 | ||
1.一种音频处理方法,其特征在于,包括:
获取待识别音频数据的声学特征,所述声学特征用于表征音高;
根据所述待识别音频数据的声学特征,确定电子乐谱中与所述待识别音频数据相对应的音符的位置。
2.根据要求1所述的音频处理方法,其特征在于,还包括:
电子乐谱中与所述待识别音频数据相对应的音符的位置与电子乐谱中带有翻页标记的音符的位置相重合,对所述电子乐谱的显示页面进行翻页操作;其中,所述翻页标记是为电子乐谱在显示时位于显示页面末尾的音符所做的标记。
3.根据权利要求1所述的音频处理方法,其特征在于,所述获取待识别音频数据的声学特征包括:
对待识别音频数据进行分帧处理,得到待识别音频数据的帧数据;
将所述待识别音频数据的帧数据从时域空间转化到频域空间,得到所述待识别音频数据的频谱图;
根据所述待识别音频数据的频谱图,提取所述待识别音频数据中各音符的声学特征;其中,所述声学特征是一个12维向量,所述12维向量中的每个维度的数值表示音符在该维度所对应的半度音区间中出现的频率。
4.根据权利要求1所述的音频处理方法,其特征在于,所述根据所述待识别音频数据的声学特征,确定电子乐谱中与所述待识别音频数据相对应的音符的位置包括:
将所述待识别音频数据的声学特征转换为第一音符集,从所述电子乐谱中获取多个连续音符形成第二音符集,计算所述第一音符集中的音符与所述第二音符集中的音符之间的差别,根据所述差别确定所述待识别音频数据与所述电子乐谱中音符的匹配情况;根据所述匹配情况确定电子乐谱中与所述待识别音频数据相对应的音符的位置;其中,
所述第一音符集中的音符与所述第二音符集中的音符具有相同的格式且所述第一音符集中的音符个数与所述第二音符集中的音符个数相同;
或,对从所述电子乐谱中所获取的多个连续音符进行转换与映射,得到第一声学特征集;计算所述待识别音频数据的声学特征与所述第一声学特征集之间的差别,根据所述差别确定所述待识别音频数据与所述电子乐谱中音符的匹配情况;根据所述匹配情况确定电子乐谱中与所述待识别音频数据相对应的音符的位置;其中,
所述第一声学特征集中所包含的声学特征的个数与所述待识别音频数据的声学特征的个数相同。
5.根据权利要求1所述的音频处理方法,其特征在于,还包括:
将待转换的乐谱输入乐谱转换模型,生成电子乐谱;其中,
所述待转换的乐谱为能被光学字符识别技术识别的乐谱;所述乐谱转换模型是以乐谱音符和对乐谱音符的标注为训练输入数据,采用机器学习方式训练得到的用于获取电子乐谱的模型;其中,所述标注用于表示乐谱音符在电子乐谱中的编码方式。
6.根据权利要求5所述的音频处理方法,其特征在于,还包括:
获取多个乐谱音符表示图;所述乐谱音符表示图是用于表示乐谱音符的图片,所述图片是能被光学字符识别技术识别的图片;
获取所述多个乐谱音符表示图的标注;
将所述多个乐谱音符表示图和所述多个乐谱音符表示图的标注作为训练输入数据,采用机器学习的方法训练出能够将待转换的乐谱转换为电子乐谱的乐谱转换模型。
7.根据权利要求5所述的音频处理方法,其特征在于,还包括:
为电子乐谱在显示时位于显示页面末尾的音符标注翻页标记。
8.一种音频处理装置,其特征在于,包括:
声学特征获取模块,用于获取待识别音频数据的声学特征,所述声学特征用于表征音高;
定位模块,用于根据所述待识别音频数据的声学特征,确定电子乐谱中与所述待识别音频数据相对应的音符的位置。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述音频处理方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述音频处理方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕文化科技有限公司;中国移动通信集团有限公司,未经咪咕文化科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911398886.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:导航定位方法及装置
- 下一篇:低压智能测控系统及方法