[发明专利]基于行为确定人员角色的方法无效
申请号: | 201110444466.7 | 申请日: | 2011-12-26 |
公开(公告)号: | CN102542292A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | 朱松纯;张建根;姚振宇 | 申请(专利权)人: | 湖北莲花山计算机视觉和信息科学研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T7/20 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 朱仁玲 |
地址: | 430074 湖北省武汉市*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 行为 确定 人员 角色 方法 | ||
技术领域
本发明涉及视频处理领域,更具体地说,本发明涉及一种基于行为确定人员角色的方法。
背景技术
随着多媒体技术以及人工智能技术的发展,自动的从原始多媒体信息中提取有用的信息即可以用来完成对多媒体资料的压缩保存和文本检索,也可以驱动其他数据,触发其他行为,从而大大减少人力的参与,扩大人机交互的应用范围。而人的角色在实际生活中起着很重要的作用,因此从多媒体资料中利用人工智能技术提取出原始资料中出现的人员的角色信息就显得有重要的意义了。
目前从多媒体资料中确定人员角色的方法主要从三种媒介入手:文本,音频,视频。现有的方法一般在一种或多种媒介提供的信息建立角色模型,通过标注数据学习模型参数,从而得到推测人员角色的具体方法。比如:基于建立视频中人群社交网络的图分割方法,基于建立在音频中人社交网络的贝叶斯方法,基于视频与文本信息利用支持向量机的分类方法。
然而,这些方法均具有一定的缺陷:由于文本信息需要大量的人工操作,音频又有一定的空间限制(距离太远会收集不到语音信息),并且很难把混合声音分离为每一个人单独的声音。因此这些方法限制了其应用的范围。而基于视频的方法一般是根据检测视频中出现的人与人之间的交互关系,从而建立一个连接每一个人的社交网络。这样即浪费了大量的人与场景交互的信息又因为人与人之间的交互关系比较难检测,因此这样的方法的实用性不强并且效果比较差。
发明内容
本发明的目的在于提供一种基于行为确定人员角色的方法,其仅依赖于视频信息,利用易于检测的人与环境物体的交互关系,易于实现,效果好。
本发明的技术方案如下:
一种基于行为确定人员角色的方法,包括以下步骤:
一、学习过程:
(1)获取视频源HL;
(2)提取视频源中人员的轨迹其中表示视频HL中第z个人员第j次出现的运动轨迹,并标注人员的角色;
(3)提取所有轨迹中人员进入场景、离开场景的位置集合以及在场景中停留的位置集合其中No表示人员进入场景,离开场景的位置点个数,Nd表示人员在空间中停留的位置点个数;
(4)根据期望最大化算法对位置集合Xo进行聚类计算以得到场景的进出口的位置,对Xd进行聚类计算以得到场景中物体的位置;
(5)根据场景的进出口的位置以及场景中物体的位置来定义人员与场景的进出口以及场景中物体之间三种空间关系:进入场景关系、离开场景关系、与物体的距离关系,以及人员在场景中物体处停留时间的时间关系,其概率具体定义为:
空间关系利用高斯分布定义如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北莲花山计算机视觉和信息科学研究院,未经湖北莲花山计算机视觉和信息科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110444466.7/2.html,转载请声明来源钻瓜专利网。