[发明专利]模型的训练及其直播处理的方法、装置、设备和存储介质有效
申请号: | 202010002154.X | 申请日: | 2020-01-02 |
公开(公告)号: | CN111222450B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 罗祥辉 | 申请(专利权)人: | 广州虎牙科技有限公司 |
主分类号: | H04N21/234 | 分类号: | H04N21/234;H04N21/258;G06V20/40;G06V10/764;G06V10/774 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 511400 广东省广州市番禺*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 及其 直播 处理 方法 装置 设备 存储 介质 | ||
本发明公开了一种模型的训练及其直播处理的方法、装置、设备和存储介质。该方法包括:接收主播客户端上传的直播视频数据;从直播视频数据中提取原始图像数据;将原始图像数据输入敏感场景识别模型中,以从直播视频数据中识别包括指定的旗帜、徽章、标志性建筑中的至少一种对象的敏感场景;若确定直播视频数据中具有敏感场景时,则对直播视频数据进行业务处理。本发明通过机器模型辅助人工审核,减少了人力成本的消耗,提高对包括敏感场景的直播视频数据的准确率和辨识效率。
技术领域
本发明实施例涉及图像识别技术,尤其涉及一种模型的训练及其直播处理的方法、装置、设备和存储介质。
背景技术
随着互联网技术的爆炸式发展,各种图像、视频和直播网站如雨后春笋般涌现。人们接触到的东西也渐渐由文字变成了图像、视频或直播等更具表现力的内容。这些网站会产生大量的图像、直播视频数据,图像比文字包含更多的信息,同时也意味着更大的数据量。
以直播平台为例,主播客户端提供视频内容,直播平台通过审核人员对直播内容进行审核,当主播客户端的到达一定数量时,会产生大量的直播视频数据,因此需要大量的审核人员对视频进行审核。一般的,平台会采取事前审核与事后举报相结合的措施。即对部分有过违规行为的主播上传的直播视频进行事前审核。开通直播间的举报功能,由观众用户举报直播间主播的违规行为。
但由于某些视频内容的特殊性,一旦播出后不仅会影响观众的观感,还会造成不良的社会影响。因此对平台方的审核人员对直播内容的事前审核提出了更高的要求。但是人工审核的效率低,容易有错漏。
发明内容
本发明提供一种模型的训练及其直播处理的方法、装置、设备和存储介质,以解决通过审核人员对直播内容进行人工审核效率低、有错漏的问题。
第一方面,本发明实施例提供了一种直播处理的方法,包括:
接收主播客户端上传的直播视频数据;
从所述直播视频数据中提取原始图像数据;
将所述原始图像数据输入敏感场景识别模型中,以从所述直播视频数据中识别包括指定的旗帜、徽章、标志性建筑中的至少一种对象的敏感场景;
若确定所述直播视频数据中具有敏感场景时,则对所述直播视频数据进行业务处理。
在此基础上,所述从所述直播视频数据中提取原始图像数据,包括:
确定目标时间;
每间隔所述目标时间,从所述直播视频数据中提取视频帧,以作为原始图像数据。
在此基础上,所述敏感场景识别模型包括主杆单元、第一稠密叠加单元、第二稠密叠加单元、第三稠密叠加单元、第四稠密叠加单元;
所述将所述原始图像数据输入敏感场景识别模型中,以从所述直播视频数据中识别包括指定的旗帜、徽章、标志性建筑中的至少一种数据的敏感场景,包括:
将所述原始图像数据输入主杆单元中进行降维处理,以输出第一图像向量;
将所述第一图像向量输入第一稠密叠加单元中提取第二图像向量;
将所述第二图像向量输入第二稠密叠加单元中提取第三图像向量;
将所述第三图像向量输入第三稠密叠加单元中提取第四图像向量;
将所述第四图像向量输入第四稠密叠加单元中提取第五图像向量;
基于所述第四图像向量与所述第五图像向量识别所述图像数据中具有的场景类别;
若所述场景类别为包括指定的旗帜、徽章、标志性建筑中的至少一种对象的敏感场景,则确定所述直播视频数据具有敏感场景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙科技有限公司,未经广州虎牙科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010002154.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:存储空间的存储优化方法、装置、设备和介质
- 下一篇:一种水量计量方法及系统