[发明专利]会议音频控制方法、系统、设备及计算机可读存储介质有效
申请号: | 201910432253.9 | 申请日: | 2019-05-21 |
公开(公告)号: | CN110300001B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 齐燕 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | H04L12/18 | 分类号: | H04L12/18;G10L15/26;G10L25/78;G06V40/16;G06F40/289 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 会议 音频 控制 方法 系统 设备 计算机 可读 存储 介质 | ||
本发明提供一种基于语音检测技术的会议音频控制方法、系统、设备及计算机可读存储介质,该方法包括:接收会议音频,对所述会议音频进行语音检测,判断所述会议音频中是否包含用户语音;若所述会议音频中包含用户语音,则提取所述会议音频中的用户语音,将所述用户语音转换为文本数据;将所述文本数据与预置的会议关键词进行对比匹配,并根据所述文本数据与所述会议关键词的匹配结果判断是否输出所述会议音频。本发明可自动静音不发言的用户,减少人工操作,提升效率。
技术领域
本发明涉及会议音频控制技术领域,尤其涉及一种会议音频控制方法、系统、设备及计算机可读存储介质。
背景技术
目前的多方会议系统多人接入时,通常需要手动控制每个与会方的音频是否打开。这需要一个会议发起人不断地看是否有人说话,并打开此方话筒。这种操作需要大量手动控制,自动化程度低,会议效率低。
发明内容
本发明的主要目的在于提供一种会议音频控制方法,旨在解决现有会议音频控制系统智能化程度较低的技术问题。
为实现上述目的,本发明提供一种会议音频控制方法,所述会议音频控制方法包括以下步骤:
接收会议音频,对所述会议音频进行语音检测,判断所述会议音频中是否包含用户语音;
若所述会议音频中包含用户语音,则提取所述会议音频中的用户语音,将所述用户语音转换为文本数据;
将所述文本数据与预置的会议关键词进行对比匹配,并根据所述文本数据与所述会议关键词的匹配结果判断是否输出所述会议音频。
可选地,所述对所述会议音频进行语音检测,判断所述会议音频中是否包含用户语音的步骤包括:
从所述会议音频中提取音频帧,并获得所述音频帧的信号能量;
将所述音频帧的信号能量与预置的能量阈值进行大小比较;
若所述音频帧的信号能量大于预置的能量阈值,则判定所述音频帧为语音帧。
可选地,所述将所述音频帧的信号能量与预置的能量阈值进行大小比较的步骤之前包括:
输出用户静音提示,对无用户语音状态下的背景噪声进行采集,并获得背景噪声能量;
基于所述背景噪声能量以及预设的阈值公式计算预置的能量阈值,所述阈值公式为:Ernew=(1-p)Erold+pEsilence,其中,Ernew为新的阈值,Erold为旧的阈值,Esilence为背景噪声能量,p为加权值,p满足0p1。
可选地,所述将所述文本数据与预置的会议关键词进行对比匹配的步骤之前包括:
获取预存的会议资料,并基于所述会议资料获得目标文本集合,将所述目标文本集合中的目标文本进行分词,获得分词后的目标词语;
获得所述目标词语的词语特征,基于所述词语特征计算所述目标词语的权重值,其中,所述词语特征至少包括词性、词位置以及词频;
将权重值大于预设阀值的所述目标词语作为预置的会议关键词。
可选地,所述将所述文本数据与预置的会议关键词进行对比匹配的步骤包括:
对所述文本数据进行分词,获得分词后的话语关键词;
将所述话语关键词与预置的会议关键词进行对比,判断所述话语关键词中是否包含所述会议关键词;
若所述话语关键词中包含所述会议关键词,则所述文本数据与所述会议关键词匹配成功。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910432253.9/2.html,转载请声明来源钻瓜专利网。