[发明专利]一种视频中的赛事比分识别方法、装置、设备及存储介质在审

申请号：	201910852491.5	申请日：	2019-09-10
公开（公告）号：	CN110781881A	公开（公告）日：	2020-02-11
发明（设计）人：	龚国平;徐叙远;吴韬;杨喻茸	申请（专利权）人：	腾讯科技(深圳)有限公司
主分类号：	G06K9/32	分类号：	G06K9/32
代理公司：	44202 广州三环专利商标代理有限公司	代理人：	郝传鑫;贾允
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频帧图像候选文本数字字符数字字符识别文本区域视频存储介质实际业务视频解码宽高比实时性准确率申请匹配图像转换
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种视频中的赛事比分识别方法、装置、设备及存储介质，所述方法包括：对目标赛事的视频进行视频解码，得到视频帧图像；确定视频帧图像中的文本区域；根据标准比分字符宽高比从所述文本区域确定多个候选文本区域；基于数字字符识别模型分别对多个候选文本区域的图像进行数字字符识别，得到多个数字字符；根据多个数字字符对应的候选文本区域在视频帧图像中的位置信息，将多个数字字符转换成赛事比分；计算赛事比分中的两个分值对应的位置间的间距；当间距与所述标准比分间距相匹配时，确定赛事比分为目标赛事的赛事比分。利用本申请提供的技术方案可以提高比分识别准确率和处理速度，满足实际业务需求中对实时性的要求。

技术领域

本申请涉及互联网通信技术领域，尤其涉及一种视频中的赛事比分识别方法、装置、设备及存储介质。

背景技术

近年来，随着人工智能(Artificial Intelligence，AI)技术研究和进步，人工智能技术在多个领域得到广泛应用，其中，人工智能在图像内容识别领域的应用，是人工智能应用的一个重要分支。

目前，在一些体育等赛事直播时，为了及时对赛况进行报道，往往需要从视频中识别出赛事比分。现有技术中，常常直接基于深度学习模型进行视频中的赛事比分识别，具体的，先利用深度学习模型进行文本区域检测，然后，再利用深度学习模型识别出文本区域的比分。但现有技术中直接基于深度学习模型进行比分的识别，需要提取的特征较多，往往无法保证识别准确率，且会带来深度学习模型的网络结构复杂，处理速度较慢，在实际业务需求中难以满足实时性的要求等问题。因此，需要提供更可靠或更有效的方案。

发明内容

本申请提供了一种视频中的赛事比分识别方法、装置、设备及存储介质，可以在提高比分识别准确率和处理速度，满足实际业务需求中对实时性的要求。

一方面，本申请提供了一种视频中的赛事比分识别方法，所述方法包括：

对目标赛事的视频进行视频解码，得到视频帧图像；

确定所述视频帧图像中的文本区域；

根据标准比分字符宽高比从所述文本区域确定多个候选文本区域；

基于数字字符识别模型分别对所述多个候选文本区域的图像进行数字字符识别，得到多个数字字符；

根据所述多个数字字符对应的候选文本区域在所述视频帧图像中的位置信息，将所述多个数字字符转换成赛事比分；

计算所述赛事比分中的两个分值对应的位置间的间距；

当所述间距与标准比分间距相匹配时，确定所述赛事比分为所述目标赛事的赛事比分。

另一方面提供了一种视频中的赛事比分识别装置，所述装置包括：

视频解码模块，用于对目标赛事的视频进行视频解码，得到视频帧图像；