[发明专利]视频文字检测方法、装置和计算机可读存储介质在审

申请号：	201811065276.2	申请日：	2018-09-13
公开（公告）号：	CN109299682A	公开（公告）日：	2019-02-01
发明（设计）人：	周多友;王长虎	申请（专利权）人：	北京字节跳动网络技术有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/32;G06K9/62
代理公司：	北京竹辰知识产权代理事务所(普通合伙) 11706	代理人：	陈龙
地址：	100041 北京市石景山区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	检测视频文字图像块文字检测视频计算机可读存储介质结果确定文字信息分块抽取检测装置硬件装置准确率图片
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开一种视频文字检测方法、视频文字检测装置、视频文字检测硬件装置和计算机可读存储介质。其中，该视频文字检测方法包括对从待检测视频中抽取的待检测图片进行分块，得到至少一个图像块；根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息。本公开实施例首先对从待检测视频中抽取的待检测图片进行分块，得到至少一个图像块，然后根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息，可以提高文字检测准确率。

技术领域

本公开涉及一种信息处理技术领域，特别是涉及一种视频文字检测方法、装置和计算机可读存储介质。

背景技术

近年来，随着多媒体技术和计算机网络的飞速发展，数字视频的容量正以惊人的速度增长。这样，从数字视频中抓取到的图像中往往包含有重要的文字信息，这在基于文字内容的视频数据库检索中起到重要的作用。即在一定程度上便于视频主要内容进行简练描述和说明，或便于视频分类，或便于非法视频的鉴定等。

视频中经常包含有文字，比如广告、介绍，或者视频中出现的标识牌上文字等，在判断视频中是否有文字时，在现在技术中，常常是通过抽取视频中的每一帧进行光学字符识别(Optical Character Recognition，OCR)识别。但是，当图像中包含的文字较小的时候，OCR识别效果并不理想，准确率也不够高。

发明内容

本公开解决的技术问题是提供一种视频文字检测方法，以至少部分地解决OCR在识别较小文字的时识别效果不理想且识别准确率低的技术问题。此外，还提供一种视频文字检测装置、视频文字检测硬件装置、计算机可读存储介质和视频文字检测终端。

为了实现上述目的，根据本公开的一个方面，提供以下技术方案：

一种视频文字检测方法，包括：

对从待检测视频中抽取的待检测图片进行分块，得到至少一个图像块；

根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息。

进一步的，所述根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息的步骤，包括：

对各图像块进行文字检测；

若检测出任一图像块中包含文字信息，则确定所述待检测视频中包含文字信息。

进一步的，所述方法还包括：

对已知包含文字信息的图片和/或已知未包含文字信息的图片进行分块，得到至少一个图像块作为训练样本；

根据是否包含文字信息对所述训练样本进行标注；