[发明专利]基于音视频的主讲跟踪多方网络会议方法和系统在审
申请号: | 202111094320.4 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113810653A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 张力;张瑞峰;朱庆祥 | 申请(专利权)人: | 广州科天视畅信息科技有限公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15;H04L29/06 |
代理公司: | 广州越华专利代理事务所(普通合伙) 44523 | 代理人: | 陈岑 |
地址: | 510000 广东省广州市黄埔区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视频 主讲 跟踪 多方 网络会议 方法 系统 | ||
本发明公开了一种基于音视频的主讲跟踪多方网络会议方法及系统,其包括建立会议发起者的会议中心和多个与会者的终端的通讯连接,还包括:记录会议中心为主讲;获取主讲的音视频数据并传输至各个终端;以及,识别音视频数据,判断是否存在主讲切换指示信息,如果是,则执行主讲切换处理;所述主讲切换处理包括:识别主讲切换指示信息后的其他音视频数据,对比与会者身份信息库得到下一个主讲人的身份数据;以及,根据与会者终端预关联的与会者身份数据,查找和确定新主讲的终端,并获取新主讲的音视频数据。本申请具有改善会议过程的流畅性的效果。
技术领域
本申请涉及线上会议技术领域,尤其是涉及一种基于音视频的主讲跟踪多方网络会议方法和系统。
背景技术
数字化技术的发展,让音视频技术融合通讯深入和生活和工作。在企业协同办公方面,上述技术尤为普及,其可方便用户居家办公、远程交流等。
公开号为CN112689115A的专利公开了一种多方会议系统的控制方法。包括:会议中心和终端耦合至通信网络;会议中心对终端进行鉴权;会议中心指定某个终端为视频接入终端Cv并将视频接入终端Cv发送的第一视频数据和多个音频数据处理生成第一混合音频数据并发送至终端。将混合音频数据转换为会议纪要文本并储存并输出。
上述提供了一种多方会议系统,其可提高会议进程中终端环境配置的速率,提高音视频编码转换的速率,提高多方会议音视频的流畅性,但是其存在以下缺陷:
对于大型会议而言,除了部分线上人员外,在主办场所,其线下也会存在不少参与人员,因此通常会以电子大屏的形式展示,然而随着主讲人员的切换,对于大屏投放内容目前依赖人工,相对呆板,切换流畅度不佳,因此本申请提出一种新的技术方案。
发明内容
为了改善会议过程的流畅性,本申请提供一种基于音视频的主讲跟踪多方网络会议方法和系统。
第一方面,本申请提供一种基于音视频的主讲跟踪多方网络会议方法,采用如下的技术方案:
一种基于音视频的主讲跟踪多方网络会议方法,包括建立会议发起者的会议中心和多个与会者的终端的通讯连接,还包括:
记录会议中心为主讲;
获取主讲的音视频数据并传输至各个终端;以及,
识别音视频数据,判断是否存在主讲切换指示信息,如果是,则执行主讲切换处理;
所述主讲切换处理包括:
识别主讲切换指示信息后的其他音视频数据,对比与会者身份信息库得到下一个主讲人的身份数据;以及,
根据与会者终端预关联的与会者身份数据,查找和确定新主讲的终端,并获取新主讲的音视频数据。
可选的,所述识别音视频数据包括:
分离音视频数据,得到音频数据和视频数据;
对音频数据执行音频转译文字,识别文字信息;和/或,
对视频数据进行图像识别,识别人体行为识别;
所述主讲切换指示信息包括预选定的文字信息和/或人体行为信息。
可选的,还包括:
获取主讲的稿件数据和稿件的章、节或页的切换设置数据;其中,章、节或页的切换设置数据包括各个章、节或页的耗时数据;以及,
根据章、节或页的切换设置数据,计算稿件总耗时并基于其生成动态的进度条;
所述进度条发送至会议中心和/或与会者的终端。
可选的,所述章、节或页的切换设置数据的产生方式包括:
分别对各个章、节或页设置耗时;或,
对若干个章、节或页设置耗时;或,
各个章、节或页设置耗时设置为耗时相同,一次性设置。
可选的,还包括:
获取预排的交互活动所发生的章、节或页,作为交互节点;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州科天视畅信息科技有限公司,未经广州科天视畅信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111094320.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种识别系统、方法及电子设备
- 下一篇:一种数据处理方法及装置