[发明专利]一种发言方的切换方法、装置、终端设备和存储介质在审

申请号：	202011211127.X	申请日：	2020-11-03
公开（公告）号：	CN112511785A	公开（公告）日：	2021-03-16
发明（设计）人：	杨春晖;韩杰;王艳辉;张召	申请（专利权）人：	视联动力信息技术股份有限公司
主分类号：	H04N7/15	分类号：	H04N7/15;G10L21/0208;G10L17/04;G10L25/24;H04L29/08
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	苏培华
地址：	100000 北京市东城区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种发言切换方法装置终端设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种发言方的切换方法、装置、终端设备和存储介质，包括：在视联网参会终端进入会议模式的情况下，获取初始声源数据；对初始声源数据中的噪声进行过滤，得到第一声源数据；通过预先训练好的高斯混合模型对第一声源数据是否为人声数据进行决策；若第一声源数据为人声数据的情况下，向会议管理服务器发送发言方角色的切换请求，会议管理服务器根据切换请求，将视联网参会终端切换为当前发言方，并向视联网参会终端返回切换响应，使得视联网参会终端进行发言，视联网终端对采集的声源数据进行精确判断，若声源数据为人声数据，则向会议管理服务器发送切换发言人请求，实现发言人的自动切换，提高切换的精确度。

技术领域

本发明涉及视联网技术领域，特别是涉及一种发言方的切换方法、装置、终端设备和存储介质。

背景技术

现有技术中，在进行视联网会议时，通过与视联网终端的麦克风能采集音频数据，视联网终端对音频数据的幅值进行判断，但是，这种方式容易将环境噪声误判断为人声，这样，视联网终端无法获取到精确的人声。

发明内容

鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种发言方的切换方法、装置、终端设备和存储介质。

第一个方面，本发明实施例提供一种发言方的切换方法，所述方法包括：

在视联网参会终端进入会议模式的情况下，获取初始声源数据；

对所述初始声源数据中的噪声进行过滤，得到第一声源数据；

将所述第一声源数据输入到预先训练好的高斯混合模型中，通过所述预先训练好的高斯混合模型对所述第一声源数据是否为人声数据进行决策；

在所述视联网参会终端确定所述第一声源数据为人声数据的情况下，向所述会议管理服务器发送发言方角色的切换请求，以使所述会议管理服务器根据所述切换请求，将所述视联网参会终端切换为当前发言方，并向所述视联网参会终端返回切换响应，使得所述视联网参会终端进行发言。

可选地，所述预先训练好的高斯混合模型是根据不同的会议室场景和参会人员的人声数据训练得到的，且所述预先训练好的高斯混合模型包括噪声高斯模型和人声高斯模型。