[发明专利]一种人体姿态基准图像库的构建方法有效
申请号: | 201510130785.9 | 申请日: | 2015-03-24 |
公开(公告)号: | CN104680188B | 公开(公告)日: | 2018-04-27 |
发明(设计)人: | 覃剑;王美华;韩亮;蒲秀娟 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 重庆为信知识产权代理事务所(普通合伙)50216 | 代理人: | 陈千 |
地址: | 400044 重*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人体 姿态 基准 图像 构建 方法 | ||
技术领域
本发明涉及到人工智能技术领域,具体地说,是一种人体姿态基准图像库的构建方法。
背景技术
在人工智能领域,人体姿势识别有着重要的理论研究和工程实践价值。一个样本丰富且高质量的人体姿势基准图像库是进行人体姿态识别研究的基础工具,可用于算法训练、测试和验证,以推动人体姿势识别技术的发展。
目前,得到人体姿势基准数据库的主要方法有两种:一是选取大量图片,通过人为手动标定的方式得到姿势数据库;二是选取大量图片,通过一些人体姿势识别算法对图片进行分类,从而得到人体姿势基准数据库。上述方法一的局限性在于:首先需要收集并选取大量图片,需要花费一定的人力物力。对于这些图片,还需要通过人为的姿势判断来确定其类别,这样必然会消耗更多的时间与资源。并且人为判断姿势还会收到一些主观因素的干扰,这也会影响最终的人体姿势基准数据库的质量。
上述方法二的局限性同方法一,也是海量图片的选择会耗费不少资源。同时目前人工智能领域的大多数人体姿态识别算法还存在着不少缺陷:现在人体动作姿态的识别主要集中在简单的人体动作姿态上,如人的某些标准姿态和一些简单的动作行为,如走、跑、蹲、站等简单规范的动作,难以识别一些复杂的姿势;利用机器学习工具进行人体动作行为的识别还处于初级阶段,在识别过程中对人体运动的模型需要增加约束条件来减少歧义性,而这些约束条件与一般的现实情形通常是不吻合的。而且通过姿势识别算法来生成姿势基准数据库还存在着特征选择困难的问题,特征的选择对于算法计算的复杂度和识别准确率均有较大的影响。
比如中国专利CN201010120591公开了一种“视频场景库生成方法及系统、搜索视频场景的方法及系统”,其主要介绍了一种生成视频场景库的方法,这种方法的主要思路是:首先对视频文件里的视频场景进行时间锚点标注和字幕附注,并提取标注的字幕段存入字幕库,然后根据标注的时间锚点对对应的视频文件进行冗余切割,截取该字幕对应的视频场景片段,存入视频场景片段库,最终建立字幕库里的字幕段和视频场景库里的视频场景片段的对应关系。该方法类似于通过人为手动标定的方式得到姿势数据库的方法,虽然可以为用户方便快捷地找到目标视频场景片段做好数据支持,但是在对视频库中的视频场景进行时间锚点标注和字幕附注时,会耗费大量的时间与人力,也有可能造成一些主观误差,影响最终生成的数据库的质量。
发明内容
针对现有技术的不足,本发明的目的是提供一种人体姿态基准图像库的构建方法,该方法采集视频游戏引导下的玩家姿态图像,并对图像采用聚类的方法生成大规模的自动标定的基准图像数据库,从而避免了人工标定姿势图片的繁琐过程,同时不需要使用复杂的人体姿势识别算法,能够节省大量的人力物力,并能够提高效率以及最终生成的人体姿态基准图像库的质量。
为达到上述目的,本发明采用的技术方案如下:
一种人体姿态基准图像库的构建方法,其关键在于具体步骤如下:
步骤1:将不同的人体姿态动作按序构建成诱导视频游戏;
步骤2:玩家按照诱导视频游戏执行相应的动作,并利用图像采集设备获取玩家在预置时间点或预置事件处的姿态图像;
步骤3:将不同玩家在相同时间点或相同事件处的姿态图像分为一类;
步骤4:对同一类中的多个姿态图像进行特征提取和聚类分析,删除置信度低的姿态图像;
步骤5:将步骤4留下的置信度高的姿态图像与诱导视频中对应时间点或对应事件处的人体姿态动作关联并标注,建立人体姿态基准图像库。
通过在固定的时间点或事件处预置人体姿态动作,建成诱导视频游戏,然后选取大量的不同玩家依据目标游戏提示进行活动的姿态图像样本。对于一个确定的时间点或事件,假设在所有的姿态图像中,大多数玩家的动作均是目标游戏所要求的动作,只有少部分人无意或者有意地做出了错误的动作。因此对该时间点或事件处的所有玩家的姿态图像进行特征提取和聚类操作,占据最大比例的动作类被认为是正确的动作,剩余的占据较小比例的动作类被认作错误的动作,从而得出与人体姿态动作对应的大量姿势图片。以此类推,对于该目标游戏的所有时间点或事件,聚类后得出的占据比例最大的姿势类别被认为是视频游戏所要求的姿态图像,最终生成一个包含不同种类人体姿态基准图像的数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510130785.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序