[发明专利]一种字幕纠错方法、装置及电子设备在审
申请号: | 202210735278.8 | 申请日: | 2022-06-27 |
公开(公告)号: | CN115034210A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 李宗祥 | 申请(专利权)人: | 咪咕文化科技有限公司;中国移动通信集团有限公司 |
主分类号: | G06F40/258 | 分类号: | G06F40/258;G06F40/279;G06F40/30;G06F40/232;G06V40/16;G06V20/62;G06V10/774 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 欧文芳 |
地址: | 100032*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字幕 纠错 方法 装置 电子设备 | ||
本申请公开了一种字幕纠错方法、装置及电子设备,涉及信息处理技术领域,以解决现有字幕纠错方法效率较低的问题。该方法包括:获取直播视频流的初始字幕;识别所述直播视频流中的目标元素,并根据所述目标元素确定目标名词集,其中,所述目标元素包括身份标识元素,所述目标名词集包括人名;利用所述目标名词集对所述初始字幕进行纠正处理,得到目标字幕;将所述目标字幕添加在所述直播视频流中。本申请实施例通过对直播视频流进行视频理解,根据其中的目标元素确定匹配词集,可以缩小字幕纠正时的匹配范围,且无需进行分词处理,从而可节省分词和匹配名词开销,提高字幕纠正效率。
技术领域
本申请涉及信息处理技术领域,尤其涉及一种字幕纠错方法、装置及电子设备。
背景技术
目前,在直播视频时,通常会采用智能字幕技术为直播视频添加字幕,但是较容易出现字幕转写错误,例如,在赛事直播时,容易出现外国人名转写不对。现有技术中,通常采用领域知识数据和文本匹配的方式对字幕进行纠错,即首先获取大量的领域知识数据,如赛事相关人名、专有名词等,并存储在数据库中,然后对初步生成的字幕进行分词,找出特定名词,接着计算切分出的名词与数据库中存储的各名词之间的距离,根据距离判断是否发生名词转写错误,若发生错误,则使用数据库中正确的名词替换错误的名词,以纠正错误的字幕。
然而,以上字幕纠错方法需要进行分词和匹配大量的领域知识数据,这会消耗大量的处理时间,导致字幕纠错的效率较低。
发明内容
本申请实施例提供一种字幕纠错方法、装置及电子设备,以解决现有字幕纠错方法效率较低的问题。
第一方面,本申请实施例提供了一种字幕纠错方法,包括:
获取直播视频流的初始字幕;
识别所述直播视频流中的目标元素,并根据所述目标元素确定目标名词集,其中,所述目标元素包括身份标识元素,所述目标名词集包括人名;
利用所述目标名词集对所述初始字幕进行纠正处理,得到目标字幕;
将所述目标字幕添加在所述直播视频流中。
可选地,所述根据所述目标元素确定目标名词集,包括:
确定所述直播视频流的各帧视频画面中各目标元素的像素占比;
根据所述各目标元素的像素占比,确定各目标元素的重要度;
根据预设的元素与名词的对应关系,确定各目标元素对应的各目标名词;
根据所述各目标元素的重要度,从各目标名词中选择重要度排序前N的N个目标名词形成所述目标名词集,其中,N为正整数。
可选地,所述识别所述直播视频流的目标元素,包括:
识别所述直播视频流的各帧视频画面中的各目标元素、包含各目标元素的帧数和各目标元素在各帧视频画面中的像素数;
所述确定所述直播视频流的各帧视频画面中各目标元素的像素占比,包括:
根据第一元素在各帧视频画面中的像素数、各帧视频画面的总像素数、各帧视频画面中包含所述第一元素的帧数和各帧视频画面的总帧数,计算所述第一元素的像素占比,其中,所述第一元素为任一目标元素。
可选地,所述根据所述各目标元素的像素占比,确定各目标元素的重要度,包括:
根据所述第一元素的像素占比、目标参数和各帧视频画面的总帧数,计算所述第一元素的重要度,其中,所述目标参数包括各帧视频画面中包含所述第一元素的帧数、所述第一元素在各帧视频画面中像素占比排序前M的帧数和各帧视频画面中不包含所述第一元素的帧数中的至少一个,M为正整数。
可选地,所述获取直播视频流的初始字幕之前,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕文化科技有限公司;中国移动通信集团有限公司,未经咪咕文化科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210735278.8/2.html,转载请声明来源钻瓜专利网。