[发明专利]视频会议系统、处理装置及视频会议方法无效
申请号: | 201610120613.8 | 申请日: | 2016-03-03 |
公开(公告)号: | CN105592268A | 公开(公告)日: | 2016-05-18 |
发明(设计)人: | 韦国华;陈冬根 | 申请(专利权)人: | 苏州科达科技股份有限公司 |
主分类号: | H04N5/232 | 分类号: | H04N5/232;H04N5/265;H04N7/15 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 臧云霄;李峰 |
地址: | 215011 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频会议系统 处理 装置 视频会议 方法 | ||
1.一种处理装置,应用于视频会议系统,所述视频会议系统包括第一摄 像机、第二摄像机以及麦克风矩阵,其特征在于,所述处理装置包括:
音源定位模块,用于根据所述麦克风矩阵所采集的音频确定第一音源以 及至少一个第二音源所在方向,所述第一音源为持续音源,所述第二音源为 动态音源;
第一控制模块,用于控制所述第一摄像机转向第一音源所在方向,并指 示所述第一摄像机采集第一音源所在方向的第一视频数据;
第一截取模块,用于获取所述第二摄像机采集的全景视频数据,并根据 所述第二音源所在方向在所述全景视频数据中截取对应于至少一个所述第二 音源所在方向的至少一个第二视频数据;
合成模块,用于将所述第一视频数据和至少一个所述第二视频数据合成 到合成画面中。
2.如权利要求1所述的处理装置,其特征在于,还包括:
语音识别模块,用于根据所述麦克风矩阵所采集的音频识别来自不同发 言人的所述第一音源以及至少一个所述第二音源。
3.如权利要求2所述的处理装置,其特征在于,还包括:
切换模块,用于:
当所述语音识别模块未识别到所述第一音源和所述第二音源时,指示所 述处理装置输出全景视频数据;
当所述语音识别模块识别到所述第一音源但未识别到所述第二音源时, 指示所述处理装置输出第一视频数据;
当所述语音识别模块识别到所述第一音源和至少一个所述第二音源时, 指示所述处理装置输出所述合成画面。
4.如权利要求1至3任一项所述的处理装置,其特征在于,所述合成模 块还用于根据所述第二视频数据的数量将所述第一视频数据和所述第二视频 数据布局在所述合成画面中。
5.如权利要求4所述的处理装置,其特征在于,所述第一视频数据在所 述合成画面中所占比例大于任一个所述第二视频数据在所述合成画面中所占 比例。
6.如权利要求1至3任一项所述的处理装置,其特征在于,
所述第一音源的音量大于第一阈值,并且所述第一音源大于第一阈值的 持续时间大于第二阈值;以及
所述第二音源在所述第一音源大于第一阈值的持续时间内大于第三阈 值,并且所述第二音源大于第三阈值的持续时间小于第四阈值。
7.如权利要求1至3任一项所述的处理装置,其特征在于,还包括:
人脸识别模块,用于对所述第一视频数据及所述全景视频数据进行人脸 识别,并根据所述第一视频数据获取与所述第一音源对应的第一发言人的位 置。
8.如权利要求7所述的处理装置,其特征在于,还包括:
定位校正模块,用于根据所述全景视频数据对所述第一视频数据中的所 述第一发言人的位置进行校正。
9.如权利要求7所述的处理装置,其特征在于,还包括:
运动跟踪模块,用于对所述第一视频数据中的所述第一发言人进行运动 检测跟踪;
所述第一控制模块还用于根据所述运动跟踪模块控制所述第一摄像机追 踪所述第一发言人。
10.如权利要求7所述的处理装置,其特征在于,还包括:
运动检测模块,用于对所述全景视频数据中的除所述第一发言人外的人 员进行运动检测;以及
第二截取模块,用于获取所述第二摄像机采集的全景视频数据,并在所 述全景视频数据截取第三视频数据,所述第三视频数据包括除所述第一发言 人外的人员移动的图像。
11.如权利要求10所述的处理装置,其特征在于,所述合成模块还用于 将所述第三视频数据合成到所述合成画面中。
12.如权利要求11所述的处理装置,其特征在于,还包括:
判断模块,用于判断使用所述第一截取模块和/或所述第二截取模块截取 所述全景视频数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州科达科技股份有限公司,未经苏州科达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610120613.8/1.html,转载请声明来源钻瓜专利网。