[发明专利]语音会议管理方法、装置、设备及介质有效
申请号: | 202011508387.3 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112634879B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 罗振阳;薛红星;翁伟东;胡玮;李坚明;方尹为;汤强 | 申请(专利权)人: | 建信金融科技有限责任公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26;H04M3/56 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张峰 |
地址: | 200120 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 会议 管理 方法 装置 设备 介质 | ||
本申请提供了一种语音会议管理方法、装置、设备及介质,语音会议方法包括:通过麦克风阵列获取参会人员的音频流,并将所述音频流输入到预先训练好的语音识别引擎;通过所述语音识别引擎生成所述音频流对应的文字内容;响应于用户针对所述文字内容的编辑操作,生成会议纪要。可以将会议发言人的讲话内容实时的转写成文字,工作人员可以在会议过程中进行简单的编辑、角色分离和重点标记,会议结束后即可快速成稿,有效减轻人员工作量、提升办公效率。
技术领域
本申请涉及语音处理的技术领域,具体而言,本申请涉及一种语音会议管理方法、装置、设备及介质。
背景技术
会议纪要整理工作,当前主要由本单位的秘书人员承担,很多重要会议及外出开会,对会议纪要的出稿质量和出稿效率要求很高,一般需要投入多个人保障出稿工作,且纪要的准确性及完整性校对困难。具体来说,当前很多外出会议或保密性高的会议,因环境及会议性质的限制,多采用录播设备或录音笔先录音,然后再回听整理的方式,当前主要通过反复听打的方式完成,工作量大且效率不高。
发明内容
本申请针对现有方式的缺点,提出一种语音会议管理方法、装置、设备及介质,用以解决上述至少一个技术问题。
一方面,本申请实施例提供了一种语音会议方法,包括:
通过麦克风阵列获取参会人员的音频流,并将所述音频流输入到预先训练好的语音识别引擎;
通过所述语音识别引擎生成所述音频流对应的文字内容;
响应于用户针对所述文字内容的编辑操作,生成会议纪要。
在本申请的一种实施例提供的语音会议方法中,在所述将所述音频流输入到预先训练好的语音识别引擎,包括:
通过预设的降噪算法确定出所述音频流中人声信号和所述噪声信号;
消除所述音频流中所述噪声信号,将消除所述噪声信号后的音频流输入到预先训练好的语音识别引擎。
在本申请的一种实施例提供的语音会议方法中,所述将消除所述噪声信号后的音频流输入到预先训练好的语音识别引擎,包括:
对所述音频流中所述人声信号进行人声增强处理;
所述将消除所述噪声信号、且已进行所述人声增强处理后的音频流输入到预先训练好的语音识别引擎。
在本申请的一种实施例提供的语音会议方法中,所述将所述音频流输入到预先训练好的语音识别引擎,包括:
在所述音频流中确定出包括人声信号的目标音频流,将所述目标音频流输入到预先训练好的语音识别引擎。
在本申请的一种实施例提供的语音会议方法中,所述在所述音频流中确定出包括人声信号的目标音频流,将所述目标音频流输入到预先训练好的语音识别引擎,包括:
检测所述音频流中的人声信号;
在检测到所述人声信号的开始时刻,开始将所述第一时刻之后的音频流输入到预先训练好的语音识别引擎;
在检测到所述人声信号的结束时刻,停止将所述音频流输入到预先训练好的语音识别引擎。
在本申请的一种实施例提供的语音会议方法中,所述通过所述语音识别引擎生成所述音频流对应的文字内容,包括:所述通过所述语音识别引擎生成所述音频流对应的多组文字内容,确定出每组所述文字内容的置信度。
在本申请的一种实施例提供的语音会议方法中,所述语音会议方法还包括:基于每组所述文字内容的置信度确定出至少一组参考文字内容并进行展示;响应于用户的选择操作,在所述至少一组参考文字内容中确定出目标文字内容;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建信金融科技有限责任公司,未经建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011508387.3/2.html,转载请声明来源钻瓜专利网。