[发明专利]用于识别图像的方法和装置在审
申请号: | 201910558688.8 | 申请日: | 2019-06-26 |
公开(公告)号: | CN110263742A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 卢艺帆 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手掌 目标视频 方法和装置 视频 视频帧 图像 人体姿态信息 电子设备 获取目标 指示目标 响应 | ||
本公开的实施例公开了用于识别图像的方法和装置。该方法的一具体实施方式包括:获取目标视频;从目标视频中提取包含手掌对象的两帧视频帧;基于两帧视频帧,识别目标视频对应的手掌的动作是否为抛动作;响应于确定目标视频对应的手掌的动作是抛动作,生成用于指示目标视频对应的手掌的动作是抛动作的识别结果。该实施方式可以使得电子设备确定出视频中是否包含执行抛动作的手掌对象,进而,识别出更丰富的人体姿态信息。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及用于识别图像的方法和装置。
背景技术
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种目标和对象的技术。
在人机交互场景下,越来越多的研究者致力于手部的交互技术的研究。相比于其他人体部位,手部自由灵活,在用户的日常生活中担负着大量的交互工作,通过手部完成的操作数不胜数。可见,现有技术中存在识别包含手部对象的图像或视频的语义信息的需求。
发明内容
本公开提出了用于识别图像的方法和装置。
第一方面,本公开的实施例提供了一种用于识别图像的方法,该方法包括:获取目标视频;从目标视频中提取包含手掌对象的两帧视频帧;基于两帧视频帧,识别目标视频对应的手掌的动作是否为抛动作;响应于确定目标视频对应的手掌的动作是抛动作,生成用于指示目标视频对应的手掌的动作是抛动作的识别结果。
在一些实施例中,基于两帧视频帧,识别目标视频对应的手掌的动作是否为抛动作,包括:将两帧视频帧输入至预先训练的识别模型,以确定目标视频对应的手掌的动作是否为抛动作,其中,识别模型用于识别包含所输入的两帧视频帧的视频对应的手掌的动作是否为抛动作。
在一些实施例中,基于两帧视频帧,识别目标视频对应的手掌的动作是否为抛动作,包括:确定两帧视频帧分别对应的手掌的法向量在预先确定的投影平面的投影坐标;基于所确定的两个投影坐标,识别目标视频对应的手掌的动作是否为抛动作。
在一些实施例中,投影平面为视频帧的成像平面;以及基于所确定的两个投影坐标,识别目标视频对应的手掌的动作是否为抛动作,包括:响应于两帧视频帧的投影坐标在预设的第一方向的坐标值之差的绝对值大于或等于预设的第一阈值,并且,两帧视频帧对应的投影坐标在预设的第二方向的坐标值之差的绝对值小于或等于预设的第二阈值,将目标视频对应的手掌的动作识别为抛动作。
在一些实施例中,投影平面为视频帧的成像平面;以及基于所确定的两个投影坐标,识别目标视频对应的手掌的动作是否为抛动作,包括:响应于两帧视频帧的投影坐标在预设的第一方向的坐标值之差的绝对值小于预设的第一阈值,或者,两帧视频帧对应的投影坐标在预设的第二方向的坐标值之差的绝对值大于预设的第二阈值,将目标视频对应的手掌的动作识别为非抛动作。
在一些实施例中,从目标视频中提取包含手掌对象的两帧视频帧,包括:从目标视频中提取包含手掌对象的相邻的两帧视频帧。
在一些实施例中,该方法还包括:响应于生成识别结果,针对目标视频中包含手掌对象的视频帧,将包含饼状物对象的图像与该视频帧进行图像融合,得到与该视频帧相对应的融合后图像,以及采用与该视频帧相对应的融合后图像替代该视频帧进行呈现。
在一些实施例中,将包含饼状物对象的图像与该视频帧进行图像融合,包括:响应于确定该视频帧为目标视频中包含手掌对象的第一帧视频帧,将包含饼状物对象的图像融合于该视频帧中手掌对象的掌心侧且与掌心对象相接触的位置。
第二方面,本公开的实施例提供了一种用于识别图像的装置,该装置包括:获取单元,被配置成获取目标视频;提取单元,被配置成从目标视频中提取包含手掌对象的两帧视频帧;识别单元,被配置成基于两帧视频帧,识别目标视频对应的手掌的动作是否为抛动作;生成单元,被配置成响应于确定目标视频对应的手掌的动作是抛动作,生成用于指示目标视频对应的手掌的动作是抛动作的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910558688.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:视频帧提取方法、装置及终端设备
- 下一篇:用于识别图像的方法和装置