[发明专利]会议发言控制方法、系统、电子设备及存储介质在审
申请号: | 202010675796.6 | 申请日: | 2020-07-14 |
公开(公告)号: | CN111833876A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 张晓燕;解斐 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;H04N7/15;G06K9/00;G06F40/194 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李文清 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 会议 发言 控制 方法 系统 电子设备 存储 介质 | ||
本发明实施例提供一种会议发言控制方法、系统、电子设备及存储介质,首先获取目标会议任一参会终端采集的音频文件;其次,基于音频文件进行参会人识别;再次,若参会人识别的结果为是,则基于音频文件的音频信息、从音频文件中提取的发言内容信息,以及任一参会终端采集的视频文件的人脸信息中的至少一种,对音频文件进行会议内容识别;最后,若会议内容识别的结果为是,则将音频文件发送至目标会议的其他参会终端。可以不需要会议主持人的提醒,直接进行自动判断是否需要关闭语音采集设备。而且,在进行自动判断时,采用了参会人识别以及会议内容识别相结合的方式,可以使得识别结果更加准确。
技术领域
本发明涉及计算机信号处理技术领域,尤其涉及一种会议发言控制方法、系统、电子设备及存储介质。
背景技术
随着远程办公的迅速发展,远程音视频会议逐渐得到广泛应用。
在远程音视频会议场景中,通常在同一个会议中包含有多人,这些人共同实现线上参会。在同一个会议场所中,参会人之间的距离一般很近,参会人在接电话或者和其他人讨论问题等处理非会议内容时,如果没有及时关闭对应的语音采集设备,将会影响其他参会人发言、讨论。
现有的方法通常是通过会议主持人提醒参会人手动关闭对应的语音采集设备,或者会议系统根据预先设定的每个语音采集设备的位置信息,自动判断是否需要关闭语音采集设备。然而,通过会议主持人提醒的方式很容易由于会议主持人的参与而扰乱会议的正常进行。而通过会议系统自动判断是否需要关闭语音采集设备的方式,由于语音采集设备通常是参会人的个人电脑携带的麦克风,无法预先知晓每个参会人对应的麦克风的位置信息,进而无法保证自动判断的结果的准确性。
发明内容
本发明实施例提供一种会议发言控制方法、系统、电子设备及存储介质,用以解决现有技术中存在的缺陷。
本发明实施例提供一种会议发言控制方法,包括:
获取目标会议任一参会终端采集的音频文件;
基于所述音频文件进行参会人识别;
若所述参会人识别的结果为是,则基于所述音频文件的音频信息、从所述音频文件中提取的发言内容信息,以及所述任一参会终端采集的视频文件的人脸信息中的至少一种,对所述音频文件进行会议内容识别;
若所述会议内容识别的结果为是,则将所述音频文件发送至所述目标会议的其他参会终端。
优选地,所述基于所述音频文件的音频信息、从所述音频文件中提取的发言内容信息,以及所述任一参会终端采集的视频文件的人脸信息中的至少一种,对所述音频文件进行会议内容识别,具体包括:
基于所述音频文件的音频信息,和/或所述视频文件的人脸信息,对所述音频文件进行会议内容的初步识别;
若初步识别的结果为是,则基于所述发言内容信息,对所述音频文件进行会议内容的精细识别。
优选地,所述基于所述音频文件的音频信息,和/或所述视频文件的人脸信息,对所述音频文件进行会议内容的初步识别,具体包括:
基于所述音频信息中的声源位置信息、所述音频信息中的声源声音能量以及所述人脸信息中的发言人嘴巴活动特征中的至少一种,对所述音频文件进行会议内容初步识别。
优选地,所述基于所述发言内容信息,对所述音频文件进行会议内容的精细识别,具体包括:
计算所述发言内容信息与所述目标会议的会议主题之间的第一相似度,和/或所述发言内容信息与历史发言内容信息之间的第二相似度;
基于所述第一相似度和/或所述第二相似度,对所述音频文件进行会议内容的精细识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010675796.6/2.html,转载请声明来源钻瓜专利网。