[发明专利]一种视频中的赛事比分识别方法、装置、设备及存储介质在审
申请号: | 201910852491.5 | 申请日: | 2019-09-10 |
公开(公告)号: | CN110781881A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 龚国平;徐叙远;吴韬;杨喻茸 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 44202 广州三环专利商标代理有限公司 | 代理人: | 郝传鑫;贾允 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频帧图像 候选文本 数字字符 数字字符识别 文本区域 视频 存储介质 实际业务 视频解码 宽高比 实时性 准确率 申请 匹配 图像 转换 | ||
本申请公开了一种视频中的赛事比分识别方法、装置、设备及存储介质,所述方法包括:对目标赛事的视频进行视频解码,得到视频帧图像;确定视频帧图像中的文本区域;根据标准比分字符宽高比从所述文本区域确定多个候选文本区域;基于数字字符识别模型分别对多个候选文本区域的图像进行数字字符识别,得到多个数字字符;根据多个数字字符对应的候选文本区域在视频帧图像中的位置信息,将多个数字字符转换成赛事比分;计算赛事比分中的两个分值对应的位置间的间距;当间距与所述标准比分间距相匹配时,确定赛事比分为目标赛事的赛事比分。利用本申请提供的技术方案可以提高比分识别准确率和处理速度,满足实际业务需求中对实时性的要求。
技术领域
本申请涉及互联网通信技术领域,尤其涉及一种视频中的赛事比分识别方法、装置、设备及存储介质。
背景技术
近年来,随着人工智能(Artificial Intelligence,AI)技术研究和进步,人工智能技术在多个领域得到广泛应用,其中,人工智能在图像内容识别领域的应用,是人工智能应用的一个重要分支。
目前,在一些体育等赛事直播时,为了及时对赛况进行报道,往往需要从视频中识别出赛事比分。现有技术中,常常直接基于深度学习模型进行视频中的赛事比分识别,具体的,先利用深度学习模型进行文本区域检测,然后,再利用深度学习模型识别出文本区域的比分。但现有技术中直接基于深度学习模型进行比分的识别,需要提取的特征较多,往往无法保证识别准确率,且会带来深度学习模型的网络结构复杂,处理速度较慢,在实际业务需求中难以满足实时性的要求等问题。因此,需要提供更可靠或更有效的方案。
发明内容
本申请提供了一种视频中的赛事比分识别方法、装置、设备及存储介质,可以在提高比分识别准确率和处理速度,满足实际业务需求中对实时性的要求。
一方面,本申请提供了一种视频中的赛事比分识别方法,所述方法包括:
对目标赛事的视频进行视频解码,得到视频帧图像;
确定所述视频帧图像中的文本区域;
根据标准比分字符宽高比从所述文本区域确定多个候选文本区域;
基于数字字符识别模型分别对所述多个候选文本区域的图像进行数字字符识别,得到多个数字字符;
根据所述多个数字字符对应的候选文本区域在所述视频帧图像中的位置信息,将所述多个数字字符转换成赛事比分;
计算所述赛事比分中的两个分值对应的位置间的间距;
当所述间距与标准比分间距相匹配时,确定所述赛事比分为所述目标赛事的赛事比分。
另一方面提供了一种视频中的赛事比分识别装置,所述装置包括:
视频解码模块,用于对目标赛事的视频进行视频解码,得到视频帧图像;
文本区域确定模块,用于确定所述视频帧图像中的文本区域;
候选文本区域确定模块,用于根据标准比分字符宽高比从所述文本区域确定多个候选文本区域;
数字字符识别模块,用于基于数字字符识别模型分别对所述多个候选文本区域的图像进行数字字符识别,得到多个数字字符;
赛事比分转换模块,用于根据所述多个数字字符对应的候选文本区域在所述视频帧图像中的位置信息,将所述多个数字字符转换成赛事比分;
间距计算模块,用于计算所述赛事比分中的两个分值对应的位置间的间距;
赛事比分确定模块,用于当所述间距与标准比分间距相匹配时,确定所述赛事比分为所述目标赛事的赛事比分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910852491.5/2.html,转载请声明来源钻瓜专利网。