[发明专利]一种字幕纠错方法、装置及电子设备在审
申请号: | 202210735278.8 | 申请日: | 2022-06-27 |
公开(公告)号: | CN115034210A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 李宗祥 | 申请(专利权)人: | 咪咕文化科技有限公司;中国移动通信集团有限公司 |
主分类号: | G06F40/258 | 分类号: | G06F40/258;G06F40/279;G06F40/30;G06F40/232;G06V40/16;G06V20/62;G06V10/774 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 欧文芳 |
地址: | 100032*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字幕 纠错 方法 装置 电子设备 | ||
1.一种字幕纠错方法,其特征在于,包括:
获取直播视频流的初始字幕;
识别所述直播视频流中的目标元素,并根据所述目标元素确定目标名词集,其中,所述目标元素包括身份标识元素,所述目标名词集包括人名;
利用所述目标名词集对所述初始字幕进行纠正处理,得到目标字幕;
将所述目标字幕添加在所述直播视频流中。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标元素确定目标名词集,包括:
确定所述直播视频流的各帧视频画面中各目标元素的像素占比;
根据所述各目标元素的像素占比,确定各目标元素的重要度;
根据预设的元素与名词的对应关系,确定各目标元素对应的各目标名词;
根据所述各目标元素的重要度,从各目标名词中选择重要度排序前N的N个目标名词形成所述目标名词集,其中,N为正整数。
3.根据权利要求2所述的方法,其特征在于,所述识别所述直播视频流的目标元素,包括:
识别所述直播视频流的各帧视频画面中的各目标元素、包含各目标元素的帧数和各目标元素在各帧视频画面中的像素数;
所述确定所述直播视频流的各帧视频画面中各目标元素的像素占比,包括:
根据第一元素在各帧视频画面中的像素数、各帧视频画面的总像素数、各帧视频画面中包含所述第一元素的帧数和各帧视频画面的总帧数,计算所述第一元素的像素占比,其中,所述第一元素为任一目标元素。
4.根据权利要求3所述的方法,其特征在于,所述根据所述各目标元素的像素占比,确定各目标元素的重要度,包括:
根据所述第一元素的像素占比、目标参数和各帧视频画面的总帧数,计算所述第一元素的重要度,其中,所述目标参数包括各帧视频画面中包含所述第一元素的帧数、所述第一元素在各帧视频画面中像素占比排序前M的帧数和各帧视频画面中不包含所述第一元素的帧数中的至少一个,M为正整数。
5.根据权利要求1所述的方法,其特征在于,所述获取直播视频流的初始字幕之前,所述方法还包括:
获取并复制所述直播视频流,得到第一直播视频流和第二直播视频流;
将所述第一直播视频流存入视频缓存队列;
所述识别所述直播视频流中的目标元素,包括:
识别所述第二直播视频流中的目标元素;
所述将所述目标字幕添加在所述直播视频流中,包括:
将所述视频缓存队列中的所述第一直播视频流与所述目标字幕结合播放。
6.根据权利要求5所述的方法,其特征在于,所述视频缓存队列包括至少两个队列;
所述将所述第一直播视频流存入视频缓存队列,包括:
将所述第一直播视频流存入第一视频缓存队列;
所述利用所述目标名词集对所述初始字幕进行纠正处理之后,所述将所述视频缓存队列中的所述第一直播视频流与所述目标字幕结合播放之前,所述方法还包括:
将所述第一视频缓存队列中的所述第一直播视频流转移至第二视频缓存队列,并清空所述第一视频缓存队列;
所述将所述视频缓存队列中的所述第一直播视频流与所述目标字幕结合播放,包括:
将所述第二视频缓存队列中的所述第一直播视频流与所述目标字幕结合播放。
7.根据权利要求1所述的方法,其特征在于,所述利用所述目标名词集对所述初始字幕进行纠正处理,得到目标字幕,包括:
将所述目标名词集中的各目标名词分别与所述初始字幕中的名词进行匹配;
在所述目标名词集中的第一目标名词与所述初始字幕中的第一名词匹配成功的情况下,使用所述第一目标名词替换所述第一名词,得到纠正后的目标字幕。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕文化科技有限公司;中国移动通信集团有限公司,未经咪咕文化科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210735278.8/1.html,转载请声明来源钻瓜专利网。