[发明专利]用于识别图像的方法和装置有效
申请号: | 201910558852.5 | 申请日: | 2019-06-26 |
公开(公告)号: | CN110263743B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 卢艺帆 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/774;G06V20/40;G06T5/50 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 李翔 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 识别 图像 方法 装置 | ||
本公开的实施例公开了用于识别图像的方法和装置。该方法的一具体实施方式包括:获取目标视频;从目标视频中提取包含手掌对象的两帧视频帧;基于两帧视频帧,识别目标视频对应的手掌的动作是否为招手动作;响应于确定目标视频对应的手掌的动作是招手动作,生成用于指示目标视频对应的手掌的动作是招手动作的识别结果。该实施方式可以使得电子设备确定出视频中是否包含执行招手动作的手掌对象,进而,识别出更丰富的人体姿态信息。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及用于识别图像的方法和装置。
背景技术
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种目标和对象的技术。
在人机交互场景下,越来越多的研究者致力于手部的交互技术的研究。相比于其他人体部位,手部自由灵活,在用户的日常生活中担负着大量的交互工作,通过手部完成的操作数不胜数。可见,现有技术中存在识别包含手部对象的图像或视频的语义信息的需求。
发明内容
本公开提出了用于识别图像的方法和装置。
第一方面,本公开的实施例提供了一种用于识别图像的方法,该方法包括:获取目标视频;从目标视频中提取包含手掌对象的两帧视频帧;基于两帧视频帧,识别目标视频对应的手掌的动作是否为招手动作;响应于确定目标视频对应的手掌的动作是招手动作,生成用于指示目标视频对应的手掌的动作是招手动作的识别结果。
在一些实施例中,基于两帧视频帧,识别目标视频对应的手掌的动作是否为招手动作,包括:将两帧视频帧输入至预先训练的识别模型,以确定目标视频对应的手掌的动作是否为招手动作,其中,识别模型用于识别包含所输入的两帧视频帧的视频对应的手掌的动作是否为招手动作。
在一些实施例中,基于两帧视频帧,识别目标视频对应的手掌的动作是否为招手动作,包括:确定两帧视频帧分别对应的手掌的法向量在预先确定的投影平面的投影坐标;基于所确定的两个投影坐标,识别目标视频对应的手掌的动作是否为招手动作。
在一些实施例中,投影平面为视频帧的成像平面;以及基于所确定的两个投影坐标,识别目标视频对应的手掌的动作是否为招手动作,包括:响应于两帧视频帧的投影坐标在预设的第一方向的坐标值之差的绝对值小于或等于预设的第一阈值,并且,两帧视频帧对应的投影坐标在预设的第二方向的坐标值之差的绝对值大于或等于预设的第二阈值,将目标视频对应的手掌的动作识别为招手动作。
在一些实施例中,投影平面为视频帧的成像平面;以及基于所确定的两个投影坐标,识别目标视频对应的手掌的动作是否为招手动作,包括:响应于两帧视频帧的投影坐标在预设的第一方向的坐标值之差的绝对值大于预设的第一阈值,或者,两帧视频帧对应的投影坐标在预设的第二方向的坐标值之差的绝对值小于预设的第二阈值,将目标视频对应的手掌的动作识别为非招手动作。
在一些实施例中,从目标视频中提取包含手掌对象的两帧视频帧,包括:从目标视频中提取包含手掌对象的相邻的两帧视频帧。
在一些实施例中,该方法还包括:响应于生成识别结果,针对目标视频中包含手掌对象的视频帧,将包含目标对象的图像与该视频帧进行图像融合,得到与该视频帧相对应的融合后图像;生成融合后视频,以及采用融合后视频替代目标视频进行呈现。
第二方面,本公开的实施例提供了一种用于识别图像的装置,该装置包括:获取单元,被配置成获取目标视频;提取单元,被配置成从目标视频中提取包含手掌对象的两帧视频帧;识别单元,被配置成基于两帧视频帧,识别目标视频对应的手掌的动作是否为招手动作;第一生成单元,被配置成响应于确定目标视频对应的手掌的动作是招手动作,生成用于指示目标视频对应的手掌的动作是招手动作的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910558852.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于识别图像的方法和装置
- 下一篇:提高无感人脸识别率的方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序