[发明专利]基于在线会议的音频处理方法、设备、存储介质及系统在审

申请号：	202110729223.1	申请日：	2021-06-29
公开（公告）号：	CN113450797A	公开（公告）日：	2021-09-28
发明（设计）人：	韦国华;顾振华;张祖良;王超	申请（专利权）人：	苏州科达科技股份有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/02;G10L15/05;G10L15/26
代理公司：	苏州谨和知识产权代理事务所(特殊普通合伙) 32295	代理人：	叶栋
地址：	215011 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于在线会议音频处理方法设备存储介质系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种基于在线会议的音频处理方法、设备、存储介质及系统，属于计算机技术领域，该方法包括；在在线会议进行过程中，获取至少两个与会终端的音频数据；从至少两路音频数据中确定主要发言人对应的一路目标音频数据；获取目标音频数据对应的第一文本数据；可以解决对每路音频数据均转换为文本数据时，导致消耗大量的转写资源的问题；通过预测当前的主要发言人，仅对该主要发言人对应的一路音频数据进行处理，一个在线会议只需要一路语音转写资源，可以减少在线会议占用的转写资源。同时实际用于转写的音频为原始音频，因此，不存在中间处理所导致的信号损失，可以提高语音转写的准确性。

【技术领域】

本申请涉及一种基于在线会议的音频处理方法、设备、存储介质及系统，属于计算机技术领域。

【背景技术】

在进行在线会议的过程中，需要对在线会议的语音进行处理以进行字幕显示或者生成会议纪要。其中，对音频进行处理包括将音频数据中的语音数据转化为文本数据的过程，即语音转写过程。

传统的视频会议中的语音转写方法包括：将所有参会的终端的音频分别进行语音转写，得到文本数据；将每一路文本数据根据时间顺序合并，得到在线会议对应的文本文件。

然而，对多路音频分别进行转写需要为每路音频均设置对应的语音转写模块，需要消耗大量的转写资源。

【发明内容】

本申请提供了一种基于在线会议的音频处理方法、设备、存储介质及系统，可以解决对每路音频数据均转换为文本数据时，导致消耗大量的转写资源的问题。本申请提供的技术方案如下：

第一方面，提供一种基于在线会议的音频处理方法，用于会议智能服务器中，所述方法包括：

在在线会议进行过程中，获取至少两个与会终端的音频数据；所述至少两个与会终端接入同一所述在线会议，每个与会终端对应一路音频数据；

从至少两路音频数据中确定主要发言人对应的一路目标音频数据；

获取所述目标音频数据对应的第一文本数据。