[发明专利]直播间歌唱识别方法、装置及服务器、存储介质有效
申请号: | 201911229100.0 | 申请日: | 2019-12-04 |
公开(公告)号: | CN111147871B | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 张大威 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | H04N21/2187 | 分类号: | H04N21/2187;H04N21/233;H04N21/439;G10L25/30;G10L25/24 |
代理公司: | 北京先进知识产权代理有限公司 11648 | 代理人: | 邵劲草 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 直播 歌唱 识别 方法 装置 服务器 存储 介质 | ||
本公开关于一种直播间歌唱识别方法、装置及服务器、存储介质,涉及直播领域。首先通过经音乐声分类模型对声音特征向量序列进行分类,并得到分类结果;如果分类结果表征声音特征向量序列包括音乐声特征向量,则从直播流中提取出包括音乐声特征向量的音频流;然后提取出包括音乐声特征向量的音频流中的人声特征向量;最后经清唱声分类模型对人声特征向量进行分类,并得到分类结果。通过上述的方式分析得出分别通过先通过音乐声分类模型对声音特征向量序列进行分类、再经过清唱声分类模型对人声特征向量进行分类,从而得到的分类结果更加精确,能够更准的确定当前的直播间的主播是否正在进行歌唱表演。
技术领域
本公开涉及直播领域,尤其涉及一种直播间歌唱识别方法、装置及服务器、存储介质。
背景技术
随着移动互联网的发展,直播应用的发展有着长足的进步和发展,主播仅需在直播应用开设直播间即可仅需直播表演。听主播演唱歌曲是直播应用用户感兴趣的表演方式之一
相关技术中,常采用混合高斯模型(Gaussian Mixture Model,GMM)或者支持向量机(Support Vector Machine,SVM)等传统的浅层模型方法进行歌唱识别,准确率低,常将主播在聊天、放背景音乐、做游戏甚至离开,即包括了许多用户不感兴趣的内容误推送至观众端,然而当用户根据直播间的摘要信息进入直播间时,导致用户的观看体验低。
发明内容
本公开提供一种直播间歌唱识别方法、装置及系统,以至少解决相关技术中对演唱语音直播片段的识别准确度低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种直播间歌唱识别方法,所述方法包括:
获得目标应用程序的直播间处于播放状态的直播流,并对所述直播流进行处理,以得到所述直播流的声音特征向量序列;
经音乐声分类模型对所述声音特征向量序列进行分类,并得到分类结果,其中,所述音乐声分类模型的目标函数用于将所述声音特征向量序列是否包括音乐声特征向量作为分类基准进行分类;
如果所述分类结果表征所述声音特征向量序列包括音乐声特征向量,则从所述直播流中提取出包括音乐声特征向量的音频流;
提取出所述包括音乐声特征向量的音频流中的人声特征向量;
经清唱声分类模型对所述人声特征向量进行分类,并得到分类结果,其中,所述清唱声分类模型的目标函数用于将所述人声特征向量是否包括清唱声特征向量作为分类基准进行分类。
根据本公开实施例的第二方面,提供了一种直播间歌唱识别装置,装置包括:
向量获得单元,被配置为执行获得目标应用程序的直播间处于播放状态的直播流,并对所述直播流进行处理,以得到所述直播流的声音特征向量序列;
第一分类单元,被配置为执行经音乐声分类模型对所述声音特征向量序列进行分类,并得到分类结果,其中,所述音乐声分类模型的目标函数用于将所述声音特征向量序列是否包括音乐声特征向量作为分类基准进行分类;
音频流提取单元,被配置为执行如果所述分类结果表征所述声音特征向量序列包括音乐声特征向量,则从所述直播流中提取出包括音乐声特征向量的音频流;
人声特征向量提取单元,被配置为执行提取出所述包括音乐声特征向量的音频流中的人声特征向量;
第二分类单元,被配置为执行经清唱声分类模型对所述人声特征向量进行分类,并得到分类结果,其中,所述清唱声分类模型的目标函数用于将所述人声特征向量是否包括清唱声特征向量作为分类基准进行分类。
根据本公开实施例的第三方面,提供了一种服务器,包括:
处理器;
用于存储处理器可执行指令的存储器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911229100.0/2.html,转载请声明来源钻瓜专利网。