[发明专利]歌曲标注检测方法、装置和系统及存储介质在审
申请号: | 202011122814.4 | 申请日: | 2020-10-20 |
公开(公告)号: | CN112231512A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 崔君君;李秀林 | 申请(专利权)人: | 标贝(北京)科技有限公司 |
主分类号: | G06F16/68 | 分类号: | G06F16/68;G06F16/683;G06F16/835 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亚南 |
地址: | 100192 北京市海淀区西小口路66号中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 歌曲 标注 检测 方法 装置 系统 存储 介质 | ||
本发明提供一种歌曲标注检测方法、装置和系统及存储介质。方法包括:获取拼音字典、针对同一待标注歌曲所标注的MusicXML文件和Interval文件;从MusicXML文件中提取第一歌词特征,该特征包括MusicXML文件中记录的每个歌词的拼音;基于拼音字典和第一歌词特征提取第一音素序列,该序列包括MusicXML文件中记录的每个歌词的每个音素;从Interval文件中提取第二歌词特征,该特征包括第二音素序列,该序列包括Interval文件中记录的每个音素;将第一音素序列中的第一音素与第二音素序列中的第二音素一一对应地进行比较;对于任一音素对,在该音素对中的音素不一致的情况下,输出第一错误反馈信息。可以自动检测MusicXML文件和Interval文件的歌曲标注结果是否一致,有助于提高歌曲标注的效率和准确度。
技术领域
本发明涉及语音处理技术领域,具体地,涉及一种歌曲标注检测方法、装置和系统及存储介质。
背景技术
歌曲合成作为语音合成的一个分支,具有较为广阔的发展前景。歌曲合成采用的算法模型在训练时需要大量的标注数据。对于歌曲标注来说,既需要标注歌曲的词谱信息,也需要标注歌曲中每个发音的声韵母时长信息。
歌曲标注的质量对于歌曲合成至关重要,现有的歌曲标注一般采用标准的音乐扩展标记语言(Music Extensible Markup Language,MusicXML)文件记录歌曲的歌词以及歌曲的谱、调、节奏等乐谱信息,采用音程(Interval)文件来记录歌曲中每个音素发音的时长,这两个文件的标注琐碎容易出错,且是分别标注,会有标注不一致或者漏标错标等问题。现有的歌曲标注结果几乎都是靠人工手动查询的,没有系统的检测工具,导致歌曲标注效率低下,且错误率高。
发明内容
为了至少部分地解决现有技术中存在的问题,提供一种歌曲标注检测方法、装置和系统及存储介质。
根据本发明一个方面,提供一种歌曲标注检测方法,包括:获取拼音字典、针对同一待标注歌曲所标注的MusicXML文件和Interval文件,其中,MusicXML文件记录有待标注歌曲的歌词的拼音,Interval文件记录有待标注歌曲的音素;从MusicXML文件中提取第一歌词特征,第一歌词特征包括MusicXML文件中记录的每个歌词的拼音;基于拼音字典和第一歌词特征提取第一音素序列,第一音素序列包括MusicXML文件中记录的每个歌词的每个音素;从Interval文件中提取第二歌词特征,第二歌词特征包括第二音素序列,第二音素序列包括Interval文件中记录的每个音素;将第一音素序列中的第一音素与第二音素序列中的第二音素一一对应地进行比较;对于任一音素对,在该音素对中的音素不一致的情况下,输出与该音素对相对应的第一错误反馈信息,第一错误反馈信息用于指示对应音素对的标注不一致,其中,每个音素对包括一组相互对应的第一音素和第二音素。
示例性地,第二歌词特征还包括第二音素序列中的每个第二音素的起始时间和结束时间,第一错误反馈信息包括对应音素对的起始时间和结束时间,其中,每个音素对的起始时间和结束时间用该音素对中的第二音素的起始时间和结束时间表示。
示例性地,在从MusicXML文件中提取第一歌词特征之后,歌曲标注检测方法还包括:基于拼音字典和第一歌词特征提取与第一音素序列中的每个第一音素相对应的上下文音素集合,上下文音素集合包括位于对应的第一音素前后的预设数目的第一音素;其中,第一错误反馈信息包括与对应音素对中的第一音素相对应的上下文音素集合。
示例性地,在将第一音素序列中的第一音素与第二音素序列中的第二音素一一对应地进行比较之前,歌曲标注检测方法还包括:对于待标注歌曲的第i句歌词,将第一音素序列中的该第i句歌词所对应的第一音素和第二音素序列中的该第i句歌词所对应的第二音素一一对应地提取到第i个合并文件中,其中,0<i≤N,其中,N为待标注歌曲的歌词总句数;将第一音素序列中的第一音素与第二音素序列中的第二音素一一对应地进行比较包括:对于第i个合并文件,将该合并文件中的第一音素和第二音素一一对应地进行比较。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于标贝(北京)科技有限公司,未经标贝(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011122814.4/2.html,转载请声明来源钻瓜专利网。