[发明专利]低码流的视频会议系统及方法、发送端设备、接收端设备有效
申请号: | 201210480773.5 | 申请日: | 2012-11-23 |
公开(公告)号: | CN103841358B | 公开(公告)日: | 2017-12-26 |
发明(设计)人: | 李霞;付贤会;张凯;修岩 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15;H04N7/14 |
代理公司: | 北京派特恩知识产权代理有限公司11270 | 代理人: | 蒋雅洁,张颖玲 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 低码流 视频会议系统 方法 发送 设备 接收 | ||
技术领域
本发明涉及多媒体通信领域,尤其涉及一种低码流的视频会议系统及低码流的视频会议数据传输方法、发送端设备、接收端设备。
背景技术
视频会议系统用于召开远程、多点及实时的会议,实现多点之间视频和声音的传输和交互。视频会议系统主要由终端和微控制单元(MCU,MicroControllerUnit)组成。在一个小型的视频会议系统中,通常由多个终端集中连接至一个MCU上,组成星型拓扑结构网络。终端是用户端设备,配有显示器、摄像机、扬声器、麦克风等多媒体部件;MCU是系统端设备,集中对各终端的多媒体信息进行交换和处理。
视频会议系统,可以说是集网络、视频和音频为一体的系统,对网络要求非常高。网络带宽实际上是整个视频会议的基础,其在视频会议中的使用也比较复杂,因为不同的需求产生不同的带宽要求。比如,参会人的多少,发言人的多少,图像的大小,很多用户希望尽可能采用大分辨率的图像,640×480的分辨率和320×240的分辨率比,数据量要增大4倍,20个会场和10个会场比数据量也大一倍。很多会议需要使用屏幕共享来给分公司,尽管这个功能非常的有价值,不过一个1024×768的屏幕是一个很大的图像,产生的流量也很大。因此如果没有足够的带宽,我们看到的视频会出现抖动,听到的声音会有杂音,使整个视频会议不能正常进行。目前很多企业都采用了专线网络,基本上能够保证视频会议系统需要的网络带宽,但专线成本很高。
综上所述,视频数据的传输会占用大量带宽,而且想要得到最佳的显示效果,传输的视频数据的分辨率就越高,从而导致更多的带宽被占用。针对传输视频数据时带宽被大量占用的问题,现有技术中没有有效的解决方案。
发明内容
有鉴于此,本发明的主要目的在于低码流的视频会议系统及方法、发送端设备、接收端设备,节约带宽,从而使IP网络的带宽能满足日益增长的视频会议业务需求。
为达到上述目的,本发明的技术方案是这样实现的:
一种低码流的视频会议系统,该系统,用于在发送端获取音频数据和视频数据并分别形成音频特征映射和视频特征映射,获取局部动态图像;发送端传输音频数据和局部动态图像到接收端,接收端根据从本端的音频特征映射和视频特征映射中提取的音频特征、视频特征及接收的所述局部动态图像整理合成出原始视频数据并播放音频数据。
其中,该系统包括:采集单元、识别单元、特征映射单元、发送单元、接收单元、特征提取比对单元、数据合成输出单元;其中,
所述采集单元,用于采集音频数据和视频数据,将采集的音频数据和视频数据发送给识别单元;
所述识别单元,用于识别出发言者身份,对采集的音频数据进行语音识别并获取音频特征,对采集的视频数据进行图像识别并获取视频特征和局部动态图像,将音频特征、视频特征和局部动态图像发送给特征映射单元;
所述特征映射单元,用于查询是否已经存在音频特征映射和视频特征映射,如果查询不到,则根据所述音频特征和所述视频特征分别生成音频特征映射和视频特征映射;
所述发送单元,用于发送音频数据和局部动态图像,音频数据的编码中携带所述发言者身份;
所述接收单元,用于接收音频数据和局部动态图像;
所述特征提取比对单元,用于从音频数据的编码中提取出所述发言者身份,查询已经存在的音频特征映射和视频特征映射,根据所述发言者身份从音频特征映射中提取出音频特征,从视频特征映射中提取出视频特征;
所述数据合成输出单元,用于采用提取出的视频特征和接收的局部动态图像合成还原出原始视频数据,并结合音频特征输出音频数据和原始视频数据。
其中,所述识别单元,进一步用于识别出发言者身份和发言者当前参与会议的会议号,由所述发言者身份和所述会议号形成身份识别码,由所述身份识别码标识与采集的音频数据和视频数据对应的身份特征;或者,仅由所述发言者身份标识所述身份特征。
其中,所述特征映射单元,进一步用于在发送端本地和网络数据库进行所述查询,在本地查询到的情况,采用本地的音频特征映射和视频特征映射;在网络数据库查询到的情况,从网络数据库下载音频特征映射和视频特征映射到本地;在本地和网络数据库都查询不到的情况,在本地生成音频特征映射和视频特征映射。
其中,所述音频特征映射由发言者身份和与所述发言者身份对应的音频特征组成;或者,所述音频特征映射由身份识别码和与所述身份识别码对应的音频特征组成,所述身份识别码由发言者身份和会议号形成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210480773.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种吹粉装置
- 下一篇:一种会议电视终端及其自恢复控制方法和相关设备