[发明专利]视频文本转换方法、移动终端和计算机可读存储介质在审
申请号: | 202010721682.0 | 申请日: | 2020-07-23 |
公开(公告)号: | CN111832529A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 黄任 | 申请(专利权)人: | 深圳传音控股股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06F40/166 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 陈文斌 |
地址: | 518057 广东省深圳市南山区粤海街道深南大道97*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 文本 转换 方法 移动 终端 计算机 可读 存储 介质 | ||
本申请公开了一种视频文本转换方法,包括以下步骤:对待转换视频的当前关键帧的内容进行识别;确定所述当前关键帧具有文本内容,将所述当前关键帧作为目标关键帧;将所述目标关键帧的文本内容转换为文本文档。本申请还公开了一种终端设备和计算机可读存储介质。本申请可以节省文档转换时间,进而提高视频转文档的转换效率。
技术领域
本申请涉及文字识别域,尤其涉及一种视频文本转换方法、移动终端和计算机可读存储介质。
背景技术
随着科技的进步,人们获取和记录信息的方式越来越多,例如通过录制视频、拍照等方式来获取信息。在一些场景中,人们更喜欢采用录制视频的方式来获取和记录信息,如在PPT演示场景下,用户为了方便,一般采用录制视频的方式实时记录PPT内容。然后采用视频记录PPT内容存在后续复习不方便的问题,如用户需要点开视频进行播放,视频播放过程中需要不断的暂停来获得PPT当前播放页面的内容,因此用户往往希望能够直接获取到视频内的文本文档。
因此出现了视频文本转换技术,然而示例性视频文本转换技术中,一般将视频的所有视频帧转换成文本文档,得到文本文档后,由用户人工手动删去一些无效的文档,这种视频转换文档的过程需要对所有视频帧进行文本转换处理,耗时长,效率低。
上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
发明内容
本申请的主要目的在于提供一种视频文本转换方法、移动终端和计算机可读存储介质,旨在解决现有视频文本转换的过程耗时长,效率低的技术问题。
为实现上述目的,本申请提供一种视频文本转换方法,所述视频文本转换方法包括以下步骤:
对待转换视频的当前关键帧的内容进行识别;
确定所述当前关键帧具有文本内容,将所述当前关键帧作为目标关键帧;
将所述目标关键帧的文本内容转换为文本文档。
可选地,所述对所述待转换视频的当前关键帧的内容进行识别的步骤包括:
识别所述待转换视频的当前关键帧的内容中是否存在文本标识;
若是,则判定所述当前关键帧具有文本内容。
可选地,所述文本标识包括文本边框。
可选地,所述确定所述当前关键帧具有文本内容,将所述当前关键帧作为目标关键帧的步骤包括:
确定所述当前关键帧具有文本内容,识别所述文本内容中的文字信息;
确定识别到所述文本内容中的文字信息,将所述当前关键帧作为目标关键帧。
可选地,所述确定所述当前关键帧具有文本内容,将所述当前关键帧作为目标关键帧的步骤包括:
确定所述当前关键帧具有文本内容,获取文本区域;
根据所述文本区域裁剪所述当前关键帧,形成以所述文本区域作为画面的裁剪关键帧;
将所述裁剪关键帧作为所述目标关键帧。
可选地,所述将所述裁剪关键帧作为所述目标关键帧步骤包括:
识别所述裁剪关键帧的形状;
若所述裁剪关键帧的形状与预设形状不匹配,根据所述预设形状调整所述裁剪关键帧,以调整后的所述裁剪关键帧作为所述目标关键帧。
可选地,所述预设形状包括矩形和正方形中的一种。
可选地,所述文本区域为文本边框所包围的区域。
可选地,所述获取文本区域的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳传音控股股份有限公司,未经深圳传音控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010721682.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种毫米波雷达信号发生器
- 下一篇:一种水产养殖用生物饲料发酵剂及其制备工艺