[发明专利]一种语音激励控制方法及装置在审
申请号: | 202010621998.2 | 申请日: | 2020-07-01 |
公开(公告)号: | CN111785297A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 吴伟;张军;肖康 | 申请(专利权)人: | 广州科天视畅信息科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;H04N7/15 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 远明 |
地址: | 510000 广东省广州市中*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 激励 控制 方法 装置 | ||
本发明实施例公开了一种语音激励控制方法,该方法包括:以预设采样率在预设采样周期内采样每一客户端的语音,以所述采样周期内各采样点中音量的均值作为所述采样周期内对应客户端的音量参考值;以所述采样周期内的各音量参考值的最大值对应的客户端作为所述采样周期的音量代表终端;以连续阈值个采样周期为一采集周期,计算所述采集周期内的每一客户端作为所述音量代表终端的次数;以所述次数最多的客户端作为当前语音激励终端。本方案保证发言人不会因为突发的声音而发生频繁的切换,保证在网络会议的场景中,发言者和主屏图像保持一致,到达声讯一致的目的。
技术领域
本发明涉及会议电视领域,具体涉及一种语音激励控制方法及装置。
背景技术
随着电信技术的发展,会议电视业务得到了越来越广泛的应用。在会议电视系统中,需要判断出会议中的多个说话方,并将其声音混合,使与会者感觉更加自然;与此同时,还要将发言人的图像广播给其他与会者。会议电视系统以会议电视多点控制单元(MCU)为核心,负责所有会场终端的图像切换和声音混合处理。由于会议电视的与会者通常为多个,需要对整个会议进行控制管理,即会议控制,例如切换发言人会场,控制混音,发言人选看会场等等。
会议控制模式包括语音激励控制模式,即在同时有多个会场发言时,以声音最大的会场作为广播端,将其声音或者图像广播到其他会场。语音激励的优点包括会议中发言者的视频流会被传送到主屏,Mix切换主屏,并同时上报激励流ID(显示当前的激励流);需要改进的地方是背景噪音的剔除或减弱。目前,会议场景中存在的问题包括:没有实现语音激励,通过轮屏的方式,进行视角切换或锁定一个平面,互动性会比较差,当有人发言的时候,很难聚焦发言;语音激励的实现基于理论,未真正运用到产品中;语音激励的算法或解决方案不够优化,导致主屏切换频繁,无法锁定,降低了客户体验。因此,现有技术需要改进。
发明内容
本发明实施例提供一种语音激励控制方法及装置,保证在网络会议的场景中,发言者和主屏图像保持一致。
本发明实施例提供的一种语音激励控制方法,包括:
以预设采样率在预设采样周期内采样每一客户端的语音,以所述采样周期内各采样点中音量的均值作为所述采样周期内对应客户端的音量参考值;
以所述采样周期内的各音量参考值的最大值对应的客户端作为所述采样周期的音量代表终端;
以连续多个采样周期为一采集周期,计算所述采集周期内的每一客户端作为所述音量代表终端的次数;
以所述次数最多的客户端作为当前语音激励终端。
可选的,在本发明的一些实施例中,所述以预设采样率在预设采样周期内采样每一客户端的语音,包括:
所述客户端至少包含两个。
可选的,在本发明的一些实施例中,所述以所述次数最多的客户端作为当前语音激励终端,包括:
所述次数最多的客户端至少包含两个,则比较所述客户端在所述采集周期内对应的采样周期;
以所述对应的采样周期中最后一采样周期对应的客户端作为当前语音激励终端。
可选的,在本发明的一些实施例中,设定一单位时间,所述单位时间内包含连续多个所述采集周期,所述单位时间内的每一采集周期对应的语音激励终端相同,则以所述语音激励终端对应的客户端作为当前发言人终端。
可选的,在本发明的一些实施例中,所述以所述语音激励终端对应的客户端作为当前发言人终端,包括:
传送所述当前发言人终端的视频至每一客户端。
可选的,在本发明的一些实施例中,所述以预设采样率在预设采样周期内采样每一客户端的语音,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州科天视畅信息科技有限公司,未经广州科天视畅信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010621998.2/2.html,转载请声明来源钻瓜专利网。