[发明专利]一种发言方的切换方法、装置、终端设备和存储介质在审

专利信息
申请号: 202011211127.X 申请日: 2020-11-03
公开(公告)号: CN112511785A 公开(公告)日: 2021-03-16
发明(设计)人: 杨春晖;韩杰;王艳辉;张召 申请(专利权)人: 视联动力信息技术股份有限公司
主分类号: H04N7/15 分类号: H04N7/15;G10L21/0208;G10L17/04;G10L25/24;H04L29/08
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 苏培华
地址: 100000 北京市东城区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 发言 切换 方法 装置 终端设备 存储 介质
【说明书】:

发明实施例提供了一种发言方的切换方法、装置、终端设备和存储介质,包括:在视联网参会终端进入会议模式的情况下,获取初始声源数据;对初始声源数据中的噪声进行过滤,得到第一声源数据;通过预先训练好的高斯混合模型对第一声源数据是否为人声数据进行决策;若第一声源数据为人声数据的情况下,向会议管理服务器发送发言方角色的切换请求,会议管理服务器根据切换请求,将视联网参会终端切换为当前发言方,并向视联网参会终端返回切换响应,使得视联网参会终端进行发言,视联网终端对采集的声源数据进行精确判断,若声源数据为人声数据,则向会议管理服务器发送切换发言人请求,实现发言人的自动切换,提高切换的精确度。

技术领域

本发明涉及视联网技术领域,特别是涉及一种发言方的切换方法、装置、终端设备和存储介质。

背景技术

现有技术中,在进行视联网会议时,通过与视联网终端的麦克风能采集音频数据,视联网终端对音频数据的幅值进行判断,但是,这种方式容易将环境噪声误判断为人声,这样,视联网终端无法获取到精确的人声。

发明内容

鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种发言方的切换方法、装置、终端设备和存储介质。

第一个方面,本发明实施例提供一种发言方的切换方法,所述方法包括:

在视联网参会终端进入会议模式的情况下,获取初始声源数据;

对所述初始声源数据中的噪声进行过滤,得到第一声源数据;

将所述第一声源数据输入到预先训练好的高斯混合模型中,通过所述预先训练好的高斯混合模型对所述第一声源数据是否为人声数据进行决策;

在所述视联网参会终端确定所述第一声源数据为人声数据的情况下,向所述会议管理服务器发送发言方角色的切换请求,以使所述会议管理服务器根据所述切换请求,将所述视联网参会终端切换为当前发言方,并向所述视联网参会终端返回切换响应,使得所述视联网参会终端进行发言。

可选地,所述预先训练好的高斯混合模型是根据不同的会议室场景和参会人员的人声数据训练得到的,且所述预先训练好的高斯混合模型包括噪声高斯模型和人声高斯模型。

可选地,所述将所述第一声源数据输入到预先训练好的高斯混合模型中,通过所述预先训练好的高斯混合模型对所述第一声源数据是否为人声数据进行决策,包括:

将第一声源数据中的语音信号特征参数输入到所述噪声高斯模型中,得到噪声概率;

将所述第一声源数据中的语音信号特征参数输入到人声高斯模型中,得到人声概率;;

若所述人声概率大于所述噪声概率,则确定所述第一声源数据为人声数据;

若所述人声概率小于所述噪声概率,则确定所述第一声源数据为噪声数据。

可选地,所述高斯混合模型是根据不同的会议室场景和参会人员的人声数据训练得到的,包括:

针对不同场景下的会议室,对会议室中的环境噪声进行多次测量,获得多个环境噪声值;

对所述多个环境噪声值计算平均值,得到所述高斯混合模型中的噪声高斯模型的均值;

获取不同参会人员的人声数据;

根据所述人声数据中的特征参数进行训练,得到所述高斯混合模型中的所述人声高斯模型;

通过期望最大化EM算法,对所述噪声高斯模型和所述人声高斯模型进行迭代,直至输出概率小于预设值时停止迭代,得到所述高斯混合模型。

可选地,在确定所述第一声源数据为人声数据的情况下,所述方法还包括:

采用滑动窗口对所述第一声源数据进行判断;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于视联动力信息技术股份有限公司,未经视联动力信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011211127.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top