[发明专利]一种基于K最近邻算法生成逐字歌词文件的系统与方法有效

申请号：	201910979892.7	申请日：	2019-10-15
公开（公告）号：	CN110853636B	公开（公告）日：	2022-04-15
发明（设计）人：	马哲;高超	申请（专利权）人：	北京雷石天地电子技术有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G06K9/62;G11B27/10
代理公司：	北京城烽知识产权代理事务所(特殊普通合伙) 11829	代理人：	王新月
地址：	100101 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于近邻算法生成逐字歌词文件系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于K最近邻算法生成逐字歌词文件的系统，其特征在于，包括：

获取模块，用于获取需要生成歌词文件的音频数据和所述音频数据中的文字；

分割模块，用于对所述的音频数据根据预设分割时长进行分割，至少分割成一个音频片段，所述分割所得的音频片段总数至少为一倍的所述文字总数；

转换模块，用于对所有音频片段进行傅里叶变换，得到对应的频域片段；

判断模块，用于获取所有频域片段能量在频域分布范围值，并利用K最近邻算法进行分类处理，判断每一个频域片段能量与其相邻的至少一个频域片段能量是否属于同一个类别；其中，所述判断模块中，所述K最近邻算法判断是否属于同一个类别的频率片段数K值可通过循环迭代进行测试，选取通过判断获取的总的时间节点数等于所述文字数所对应的K值；

节点模块，用于当待判断频域片段能量和与其相邻的至少一个频域片段能量在频域分布范围值不属于同一个类别时，将该段频域片段对应的时间设定为一个时间节点；

生成模块，用于将判断所得的时间节点与所述文字根据先后次序一一对应，生成逐字歌词文件。

2.根据权利要求1所述的系统，其特征在于，所述获取模块包括语音识别模块，用于通过智能语音识别技术，识别所述音频数据中的所有文字。

3.根据权利要求2所述的系统，其特征在于，所述生成模块包括：用于将判断所得的所述时间节点与所述语音识别模块识别的文字根据先后次序进行一一对应，生成逐字歌词文件。

4.根据权利要求1所述的系统，其特征在于，所述分割模块的预设分割时长可根据所述音频数据的舒缓程度设定。

5.一种基于K最近邻算法生成逐字歌词文件的方法，其特征在于，包括：

获取需要生成歌词文件的音频数据和所述音频数据中的文字；

对所述的音频数据根据预设分割时长进行分割，至少分割成一个音频片段，所述分割所得的音频片段总数至少为一倍的所述文字总数；

对所有音频片段进行傅里叶变换，得到对应的频域片段；

获取所有频域片段能量在频域分布范围值，并利用K最近邻算法进行分类处理，判断每一个频域片段能量与其相邻的至少一个频域片段能量是否属于同一个类别；其中，所述K最近邻算法判断是否属于同一个类别的频率片段数K值可通过循环迭代进行测试，选取通过判断获取的总的时间节点数等于所述文字数所对应的K值；

当待判断频域片段能量和与其相邻的至少一个频域片段能量在频域分布范围值不属于同一个类别时，将该段频域片段对应的时间设定为一个时间节点；

将判断所得的时间节点与所述文字根据先后次序一一对应，生成逐字歌词文件。