[发明专利]连麦方法、直播显示方法、装置、设备及存储介质有效

专利信息
申请号: 202011307652.1 申请日: 2020-11-20
公开(公告)号: CN112511850B 公开(公告)日: 2023-08-08
发明(设计)人: 肖定坤 申请(专利权)人: 广州繁星互娱信息科技有限公司
主分类号: H04N21/2187 分类号: H04N21/2187;H04N21/239;H04N21/254;H04N21/258;H04N21/431;H04N21/475;H04N21/485
代理公司: 北京三高永信知识产权代理有限责任公司 11138 代理人: 郭翱杰
地址: 510032 广东省广州市黄埔区广新*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 方法 直播 显示 装置 设备 存储 介质
【权利要求书】:

1.一种连麦方法,其特征在于,所述方法包括:

获取包括不同种类的乐器演奏视频的训练数据集,并按照所述乐器演奏视频在所述训练数据集中的排列顺序,分别提取每个所述乐器演奏视频的音频、视频帧和视频帧序列,从而得到音频数据集、视频帧数据集和视频帧序列数据集;其中,所述视频帧为对应的乐器演奏视频中在时间序列上居中的视频帧,所述视频帧序列通过在对应的乐器演奏视频中以目标时长为间隔提取得到;

训练乐器演奏行为识别模型,包括:

通过所述音频数据集以及对应的乐器类型数据集训练音频分类模型,并获得通过所述音频分类模型预测所述音频数据集中任一音频对应的不同乐器种类的概率所组成的集合,其中所述音频分类模型为一维卷积神经网络;

通过所述视频帧数据集以及对应的乐器类型数据集训练乐器识别模型,并获得通过所述乐器识别模型预测所述视频帧数据集中任一视频帧对应的不同乐器种类的概率所组成的集合,其中所述乐器识别模型为二维卷积神经网络;

通过所述视频帧序列数据集以及对应的乐器类型数据集训练演奏行为识别模型,并获得通过所述演奏行为识别模型预测所述视频帧序列数据集中任一视频帧序列反映的乐器演奏行为对应的不同乐器种类的概率所组成的集合,其中所述演奏行为识别模型为三维卷积神经网络;

根据所述音频数据集中任一音频对应的不同乐器种类的概率所组成的集合、所述视频帧数据集中任一视频帧对应的不同乐器种类的概率所组成的集合,以及所述视频帧序列数据集中任一视频帧序列反映的乐器演奏行为对应的不同乐器种类的概率所组成的集合,得到融合数据集;

通过所述融合数据集以及对应的乐器类型数据集训练演奏行为决策模型,并获得所述演奏行为决策模型预测所述训练数据集中任一乐器演奏视频对应的不同乐器种类的概率所组成的集合,其中所述演奏行为决策模型为三层全连接层神经网络;

获取第一主播账号的直播流,并调用行为识别模型对所述直播流进行预测,得到直播表演类型,所述第一主播账号处于直播状态,所述行为识别模型是通过表演样本集训练得到的神经网络模型,所述表演样本集包括表演样本视频以及所述表演样本视频对应的表演类型,其中所述行为识别模型包括所述乐器演奏行为识别模型;

响应于所述第一主播账号的连麦请求,确定与所述第一主播账号匹配的第二主播账号,所述第二主播账号和所述第一主播账号属于相同的所述直播表演类型,所述第二主播账号处于直播状态;

向所述第一主播账号推荐所述第二主播账号进行连麦;

其中,所述调用行为识别模型对所述直播流进行预测,得到直播表演类型,包括:

调用所述音频分类模型对所述直播流的音频帧进行预测,得到第一预测乐器种类,所述音频帧包括所述直播流的全部音频帧;

调用所述乐器识别模型对所述直播流的视频帧进行预测,得到第二预测乐器种类,所述视频帧包括所述直播流的任一视频帧;

调用所述演奏行为识别模型对所述直播流的视频帧进行预测,得到预测演奏行为,所述视频帧包括所述直播流的至少一帧视频帧组成的视频帧序列,所述预测演奏行为用于反映所述第一主播账号直播过程中存在乐器演奏行为以及所述乐器演奏行为演奏的乐器种类;

调用所述演奏行为决策模型根据所述第一预测乐器种类、所述第二预测乐器种类以及所述预测演奏行为,确定所述直播表演类型。

2.根据权利要求1所述的方法,其特征在于,所述行为识别模型还包括舞蹈行为识别模型或演唱行为识别模型;

所述调用行为识别模型对所述直播流进行预测,得到直播表演类型,还包括:

调用所述舞蹈行为识别模型或所述演唱行为识别模型,对所述直播流进行预测。

3.根据权利要求2所述的方法,其特征在于,所述舞蹈行为识别模型包括第一舞蹈行为识别模型以及第二舞蹈行为识别模型;

调用所述舞蹈行为识别模型对所述直播流进行预测,包括:

对所述直播流的视频帧进行处理,得到所述视频帧对应的光流图;

调用所述第一舞蹈行为识别模型对所述视频帧进行预测,得到第一预测舞蹈行为概率;

调用所述第二舞蹈行为识别模型对所述光流图进行预测,得到第二预测舞蹈行为概率;

根据所述第一预测舞蹈行为概率以及所述第二预测舞蹈行为概率确定所述直播表演类型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州繁星互娱信息科技有限公司,未经广州繁星互娱信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011307652.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top