[发明专利]基于音视频的主讲跟踪多方网络会议方法和系统在审
申请号: | 202111094320.4 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113810653A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 张力;张瑞峰;朱庆祥 | 申请(专利权)人: | 广州科天视畅信息科技有限公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15;H04L29/06 |
代理公司: | 广州越华专利代理事务所(普通合伙) 44523 | 代理人: | 陈岑 |
地址: | 510000 广东省广州市黄埔区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视频 主讲 跟踪 多方 网络会议 方法 系统 | ||
1.一种基于音视频的主讲跟踪多方网络会议方法,包括建立会议发起者的会议中心和多个与会者的终端的通讯连接,其特征在于,还包括:
记录会议中心为主讲;
获取主讲的音视频数据并传输至各个终端;以及,
识别音视频数据,判断是否存在主讲切换指示信息,如果是,则执行主讲切换处理;
所述主讲切换处理包括:
识别主讲切换指示信息后的其他音视频数据,对比与会者身份信息库得到下一个主讲人的身份数据;以及,
根据与会者终端预关联的与会者身份数据,查找和确定新主讲的终端,并获取新主讲的音视频数据。
2.根据权利要求1所述的基于音视频的主讲跟踪多方网络会议方法,其特征在于,所述识别音视频数据包括:
分离音视频数据,得到音频数据和视频数据;
对音频数据执行音频转译文字,识别文字信息;和/或,
对视频数据进行图像识别,识别人体行为识别;
所述主讲切换指示信息包括预选定的文字信息和/或人体行为信息。
3.根据权利要求1所述的基于音视频的主讲跟踪多方网络会议方法,其特征在于,还包括:
获取主讲的稿件数据和稿件的章、节或页的切换设置数据;其中,章、节或页的切换设置数据包括各个章、节或页的耗时数据;以及,
根据章、节或页的切换设置数据,计算稿件总耗时并基于其生成动态的进度条;
所述进度条发送至会议中心和/或与会者的终端。
4.根据权利要求3所述的基于音视频的主讲跟踪多方网络会议方法,其特征在于,所述章、节或页的切换设置数据的产生方式包括:
分别对各个章、节或页设置耗时;或,
对若干个章、节或页设置耗时;或,
各个章、节或页设置耗时设置为耗时相同,一次性设置。
5.根据权利要求4所述的基于音视频的主讲跟踪多方网络会议方法,其特征在于,还包括:
获取预排的交互活动所发生的章、节或页,作为交互节点;以及
根据交互节点确定其在进度条上预发生的区段,作为交互区段;
所述识别音视频数据执行于交互区段。
6.根据权利要求5所述的基于音视频的主讲跟踪多方网络会议方法,其特征在于,还包括:
对所述音频数据做静音检测;或,
获取的音视频数据为静音检测后的数据;
在执行音频转译文字前,对静音检测得到的特殊编码帧剔除。
7.根据权利要求1所述的基于音视频的主讲跟踪多方网络会议方法,其特征在于,还包括:
获取与会者终端的反馈信息;
判断是否有举手行为,如果是,则发送举手提示至会议中心;
判断会议中心的反馈信息是否同意举行行为,如果是,则传输与会者终端的反馈信息中的音视频数据至会议中心。
8.一种基于音视频的主讲跟踪多方网络会议系统,其特征在于,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如权利要求1至7中任一种方法的计算机程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州科天视畅信息科技有限公司,未经广州科天视畅信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111094320.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种识别系统、方法及电子设备
- 下一篇:一种数据处理方法及装置