[发明专利]一种文字区域确定方法和装置在审
申请号: | 201810639618.0 | 申请日: | 2018-06-20 |
公开(公告)号: | CN110619257A | 公开(公告)日: | 2019-12-27 |
发明(设计)人: | 郭金马;商磊 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 11227 北京集佳知识产权代理有限公司 | 代理人: | 郭化雨;朱静 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频帧 文字区域 文本区域 文字内容 位置变化信息 待检测区域 关键点 视频 特征确定 计算量 中文字 申请 应用 | ||
本申请实施例公开了一种文字区域确定方法,应用于视频中,方法包括:确定第一视频帧中的文本区域;提取文本区域中关键点的第一特征;根据文本区域在第一视频帧中的位置信息,确定第二视频帧中的待检测区域;提取待检测区域中关键点的第二特征;根据第一特征和第二特征确定位置变化信息;根据文字内容在第一视频帧中的位置信息和位置变化信息确定文字内容在第二视频帧中的文字区域。可见,本申请可以实现对第二视频帧中文字内容所在文字区域的确定,并且在确定过程中主要依据的是第一视频帧和第二视频帧中的文字内容,计算量相对较少,可以准确、快速的实现文字区域的确定,提高与视频的同步程度。
技术领域
本申请涉及文字区域确定领域,特别是涉及一种文字区域确定方法和装置。
背景技术
随着图像识别技术的发展,可以实现实时确定出视频中具有文字内容的文字区域。在能够实时确定出文字区域的前提下,可以在视频中添加与该文字区域对应的内容,例如特效、翻译等。
然而,目前并没有专门针对视频中文字区域确定的手段,只能通过传统的物体追踪方式来实时确定视频中的文字区域。
传统的物体追踪方式需要关注视频帧中包含的全部信息,故实现定位、追踪视频中文字区域需要付出高计算量的代价,计算速度较慢,难以实现与视频同步。故此,基于物体追踪方式确定出的文字区域添加相应内容时,添加内容的位置和视频帧中文字区域的实际位置可能会有偏差,添加的内容也可能与文字区域不符。
发明内容
为了解决上述技术问题,本申请提供了一种文字区域确定方法,以希望可以准确、快速的实现文字区域的确定,提高与视频的同步程度
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种文字区域确定方法,应用于视频中,所述方法包括:
确定第一视频帧中的文本区域;
提取所述文本区域中关键点的第一特征;所述文本区域中关键点至少包括所述文本区域中文字内容的一部分,所述第一特征包括所述文本区域中关键点的位置特征和纹理特征;
根据所述文本区域在所述第一视频帧中的位置信息,确定第二视频帧中的待检测区域,所述第二视频帧为在所述视频的播放顺序下处于所述第一视频帧之后的视频帧;
提取所述待检测区域中关键点的第二特征;所述第二特征包括所述待检测区域中关键点的位置特征和纹理特征;
根据所述第一特征和所述第二特征确定位置变化信息,所述位置变化信息用于标识所述文字内容从所述第一视频帧到所述第二视频帧的位置变化;
根据所述文字内容在所述第一视频帧中的位置信息和所述位置变化信息确定所述文字内容在所述第二视频帧中的文字区域。
可选的,所述第一视频帧与所述第二视频帧为在所述视频的播放顺序下相邻的视频帧;
或者,
所述第一视频帧为首张视频帧,所述首张视频帧为在所述视频的播放顺序下首次出现包括了所述文字内容的视频帧。
可选的,若所述第一视频帧与所述第二视频帧为在所述视频的播放顺序下相邻的视频帧,则所述确定第一视频帧中的文本区域,包括:
将第三视频帧中的文本区域确定为所述第一视频帧中的文本区域,所述第三视频帧为在所述视频的播放顺序下与所述第一视频帧相邻、且处于所述第一视频帧之后的视频帧。
可选的,若所述第一视频帧为首张视频帧,则所述确定第一视频帧中的文本区域,包括:
识别所述文字内容在所述第一视频帧中的文字区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810639618.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:道路监控检测方法及装置
- 下一篇:一种基于高分辨率遥感影像的道路轨迹核查方法