[发明专利]语音会议管理方法、装置、设备及介质有效
申请号: | 202011508387.3 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112634879B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 罗振阳;薛红星;翁伟东;胡玮;李坚明;方尹为;汤强 | 申请(专利权)人: | 建信金融科技有限责任公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26;H04M3/56 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张峰 |
地址: | 200120 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 会议 管理 方法 装置 设备 介质 | ||
1.一种语音会议方法,其特征在于,包括:
通过麦克风阵列获取参会人员的音频流,并将所述音频流输入到预先训练好的语音识别引擎;
通过所述语音识别引擎生成所述音频流对应的文字内容;
响应于用户针对所述文字内容的编辑操作,生成会议纪要;
所述通过所述语音识别引擎生成所述音频流对应的文字内容,包括:检测设备运行状态,根据所述设备运行状态选择所述语音识别引擎的识别策略;所述检测设备运行状态包括检测设备的CPU的负载,当所述CPU的负载超过预设负载值时,选择所述语音识别引擎的第一识别策略,当所述CPU的负载未超过预设负载值时,选择所述语音识别引擎的第二识别策略;所述第一识别策略相较所述第二识别策略计算量较小,所述第二识别策略相较所述第一识别策略精度更高;
通过所述语音识别引擎被选择的识别策略生成所述音频流对应的文字内容。
2.根据权利要求1所述的语音会议方法,其特征在于,在所述将所述音频流输入到预先训练好的语音识别引擎,包括:
通过预设的降噪算法确定出所述音频流中人声信号和噪声信号;
消除所述音频流中所述噪声信号,将消除所述噪声信号后的音频流输入到预先训练好的语音识别引擎。
3.根据权利要求2所述的语音会议方法,其特征在于,所述将消除所述噪声信号后的音频流输入到预先训练好的语音识别引擎,包括:
对所述音频流中所述人声信号进行人声增强处理;
所述将消除所述噪声信号、且已进行所述人声增强处理后的音频流输入到预先训练好的语音识别引擎。
4.根据权利要求1所述的语音会议方法,其特征在于,所述将所述音频流输入到预先训练好的语音识别引擎,包括:
在所述音频流中确定出包括人声信号的目标音频流,将所述目标音频流输入到预先训练好的语音识别引擎。
5.根据权利要求4所述的语音会议方法,其特征在于,所述在所述音频流中确定出包括人声信号的目标音频流,将所述目标音频流输入到预先训练好的语音识别引擎,包括:
检测所述音频流中的人声信号;
在检测到所述人声信号的开始时刻,开始将所述开始时刻之后的音频流输入到预先训练好的语音识别引擎;
在检测到所述人声信号的结束时刻,停止将所述音频流输入到预先训练好的语音识别引擎。
6.根据权利要求1所述的语音会议方法,其特征在于,所述通过所述语音识别引擎生成所述音频流对应的文字内容,包括:所述通过所述语音识别引擎生成所述音频流对应的多组文字内容,确定出每组所述文字内容的置信度。
7.根据权利要求6所述的语音会议方法,其特征在于,
所述语音会议方法还包括:基于每组所述文字内容的置信度确定出至少一组参考文字内容并进行展示;响应于用户的选择操作,在所述至少一组参考文字内容中确定出目标文字内容;
所述响应于用户针对所述文字内容的编辑操作,生成会议纪要,包括:响应于用户针对所述目标文字内容的编辑操作,生成会议纪要。
8.根据权利要求1所述的语音会议方法,其特征在于,所述通过所述语音识别引擎生成所述音频流对应的文字内容,包括:
根据预储的样本人声信号确定出所述音频流中每个人声信号的发言人;
所述通过所述语音识别引擎生成所述音频流中每个人声信号的文字内容,并记录每个文字内容对应的发言人。
9.根据权利要求1所述的语音会议方法,其特征在于,所述语音会议方法还包括:在检测到所述音频流中包含预设短语时,响应于所述预设短语对应的请求,与用户进行交互。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建信金融科技有限责任公司,未经建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011508387.3/1.html,转载请声明来源钻瓜专利网。