[发明专利]一种字幕纠错方法、装置及电子设备在审

申请号：	202210735278.8	申请日：	2022-06-27
公开（公告）号：	CN115034210A	公开（公告）日：	2022-09-09
发明（设计）人：	李宗祥	申请（专利权）人：	咪咕文化科技有限公司;中国移动通信集团有限公司
主分类号：	G06F40/258	分类号：	G06F40/258;G06F40/279;G06F40/30;G06F40/232;G06V40/16;G06V20/62;G06V10/774
代理公司：	北京银龙知识产权代理有限公司 11243	代理人：	欧文芳
地址：	100032***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种字幕纠错方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种字幕纠错方法、装置及电子设备，涉及信息处理技术领域，以解决现有字幕纠错方法效率较低的问题。该方法包括：获取直播视频流的初始字幕；识别所述直播视频流中的目标元素，并根据所述目标元素确定目标名词集，其中，所述目标元素包括身份标识元素，所述目标名词集包括人名；利用所述目标名词集对所述初始字幕进行纠正处理，得到目标字幕；将所述目标字幕添加在所述直播视频流中。本申请实施例通过对直播视频流进行视频理解，根据其中的目标元素确定匹配词集，可以缩小字幕纠正时的匹配范围，且无需进行分词处理，从而可节省分词和匹配名词开销，提高字幕纠正效率。

技术领域

本申请涉及信息处理技术领域，尤其涉及一种字幕纠错方法、装置及电子设备。

背景技术

目前，在直播视频时，通常会采用智能字幕技术为直播视频添加字幕，但是较容易出现字幕转写错误，例如，在赛事直播时，容易出现外国人名转写不对。现有技术中，通常采用领域知识数据和文本匹配的方式对字幕进行纠错，即首先获取大量的领域知识数据，如赛事相关人名、专有名词等，并存储在数据库中，然后对初步生成的字幕进行分词，找出特定名词，接着计算切分出的名词与数据库中存储的各名词之间的距离，根据距离判断是否发生名词转写错误，若发生错误，则使用数据库中正确的名词替换错误的名词，以纠正错误的字幕。

然而，以上字幕纠错方法需要进行分词和匹配大量的领域知识数据，这会消耗大量的处理时间，导致字幕纠错的效率较低。

发明内容

本申请实施例提供一种字幕纠错方法、装置及电子设备，以解决现有字幕纠错方法效率较低的问题。

第一方面，本申请实施例提供了一种字幕纠错方法，包括：

获取直播视频流的初始字幕；

识别所述直播视频流中的目标元素，并根据所述目标元素确定目标名词集，其中，所述目标元素包括身份标识元素，所述目标名词集包括人名；

利用所述目标名词集对所述初始字幕进行纠正处理，得到目标字幕；

将所述目标字幕添加在所述直播视频流中。

可选地，所述根据所述目标元素确定目标名词集，包括：

确定所述直播视频流的各帧视频画面中各目标元素的像素占比；

根据所述各目标元素的像素占比，确定各目标元素的重要度；

根据预设的元素与名词的对应关系，确定各目标元素对应的各目标名词；