[发明专利]一种视频会议实现方法及装置在审
申请号: | 202111160016.5 | 申请日: | 2021-09-30 |
公开(公告)号: | CN113923398A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 王乐天;汤仲喆;段小燕;孙孟雷 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15;H04N19/48;H04N19/51;H04N19/543;H04L47/25;G06T7/11;G06T7/194;G06V10/46;G06N3/06 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王涛;汤在彦 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频会议 实现 方法 装置 | ||
本申请提供一种视频会议实现方法及装置,涉及人工智能领域,也可用于金融领域,包括:利用预先训练的显著对象检测模型确定各视频帧图像的显著区域;将各所述视频帧图像进行分组,并从各分组中分别选取显著区域最大的视频帧图像作为关键帧图像;根据网络当前最大的实际码率传输各关键帧图像,完成视频会议。本申请能够改善低带宽条件下的视频会议体验,实时调整视频数据传输量,减少网络卡顿,突出重点内容。
技术领域
本申请涉及人工智能领域,可以用于金融领域,具体是一种视频会议实现方法及装置。
背景技术
随着互联网的发展,视频会议技术越发成熟,相比于线下开会,视频会议可以不受空间限制,实现更有效率的实时沟通。然而,视频会议仍然存在一些技术问题,影响着人们实际的沟通效果,例如当网络请求量过大带宽不足时,容易出现音画不同步,画面卡顿的现象。
针对上述现象,经过分析,技术人员认识到,会议视频中只有部分显著前景区域图像是必须进行展示的,例如人脸及幻灯片内容等。大部分背景区域图像不能给参会者带来有效信息,浪费了大量带宽。更为糟糕的是,这部分背景区域图像所占据的图像显示比例往往远大于显著前景区域图像。如何将上述显著前景区域图像与背景区域图像分割,从而减少不必要的数据传输量称为需要解决的技术问题。
发明内容
针对现有技术中的问题,本申请提供一种视频会议实现方法及装置,能够改善低带宽条件下的视频会议体验,实时调整视频数据传输量,减少网络卡顿,突出重点内容。
为解决上述技术问题,本申请提供以下技术方案:
第一方面,本申请提供一种视频会议实现方法,包括:
利用预先训练的显著对象检测模型确定各视频帧图像的显著区域;
将各所述视频帧图像进行分组,并从各分组中分别选取显著区域最大的视频帧图像作为关键帧图像;
根据网络当前最大的实际码率传输各关键帧图像,完成视频会议。
进一步地,预先训练显著对象检测模型的步骤,包括:
利用残差网络模型学习历史视频帧图像的图像特征;所述图像特征包括对比度特征、亮度特征及像素特征;
根据学习到的图像特征更新所述残差网络模型中的神经元参数;
根据更新的神经元参数进行语义维度学习,提升所述残差网络模型的检测精度,得到所述显著对象检测模型。
进一步地,所述利用预先训练的显著对象检测模型确定各视频帧图像的显著区域,包括:
利用所述显著对象检测模型对各视频帧图像的像素点进行二值化处理,得到所述显著区域。
进一步地,所述将各所述视频帧图像进行分组,并从各分组中分别选取显著区域最大的视频帧图像作为关键帧图像,包括:
分别确定各所述视频帧图像的显著区域中的显著像素点个数;
从所述分组中选取包含显著像素点个数最多的视频帧图像作为所述关键帧图像。
进一步地,所述根据网络当前最大的实际码率传输各关键帧图像,完成视频会议,包括:
利用拥塞控制算法确定所述当前最大的实际码率;
根据所述当前最大的实际码率确定各关键帧图像中的显著区域的传输码率及非显著区域的传输码率;
按照所述显著区域的传输码率传输所述显著区域,按照所述非显著区域的传输码率传输所述非显著区域,完成视频会议。
第二方面,本申请提供一种视频会议实现装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111160016.5/2.html,转载请声明来源钻瓜专利网。