[发明专利]基于在线会议的音频处理方法、设备、存储介质及系统在审
申请号: | 202110729223.1 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113450797A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 韦国华;顾振华;张祖良;王超 | 申请(专利权)人: | 苏州科达科技股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/02;G10L15/05;G10L15/26 |
代理公司: | 苏州谨和知识产权代理事务所(特殊普通合伙) 32295 | 代理人: | 叶栋 |
地址: | 215011 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 在线 会议 音频 处理 方法 设备 存储 介质 系统 | ||
1.一种基于在线会议的音频处理方法,其特征在于,用于会议智能服务器中,所述方法包括:
在在线会议进行过程中,获取至少两个与会终端的音频数据;所述至少两个与会终端接入同一所述在线会议,每个与会终端对应一路音频数据;
从至少两路音频数据中确定主要发言人对应的一路目标音频数据;
获取所述目标音频数据对应的第一文本数据。
2.根据权利要求1所述的方法,其特征在于,所述从至少两路音频数据中确定主要发言人对应的一路目标音频数据,包括:
确定每路音频数据中是否包括语音数据;
当存在至少两路音频数据包括语音数据时,获取所述语音数据的语音特征;
根据所述语音特征,从包括所述语音数据的至少两路音频数据中确定所述目标音频数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述语音特征,从包括所述语音数据的至少两路音频数据中确定所述目标音频数据,包括:
所述语音特征包括语音能量,将所述语音能量最大的一路音频数据确定为所述目标音频数据;
或者,
所述语音特征包括语音能量和语音持续时长,将所述语音能量超过预设阈值、且所述语音持续时长最大的一路音频数据确定为所述目标音频数据;
或者,
所述语音特征包括语音持续时长,将所述语音持续时长超过预设时长阈值、且所述语音持续时长最大的一路音频数据确定为所述目标音频数据。
4.根据权利要求1所述的方法,其特征在于,所述从至少两路音频数据中确定主要发言人对应的一路目标音频数据,还包括:
获取所述在线会议中指定的主要发言人;
从至少两路音频数据中确定所述指定的主要发言人对应的一路音频数据,得到所述目标音频数据。
5.根据权利要求1所述的方法,其特征在于,所述获取所述目标音频数据对应的第一文本数据,包括:
使用语音转写算法对所述目标音频数据进行处理,得到所述第一文本数据;
或者,
将所述目标音频数据发送至指定设备,以供所述指定设备使用语音转写算法对所述目标音频数据进行处理,得到所述目标音频数据对应的第一文本数据;接收所述指定设备发送的所述目标音频数据对应的第一文本数据。
6.根据权利要求1所述的方法,其特征在于,所述获取所述至少两个与会终端的音频数据,包括:
当会议控制平台开启混音功能时,获取所述会议控制平台发送的混音列表,所述混音列表包括所述至少两路音频数据的数据标识;所述会议控制平台用于为所述至少两个与会终端提供在线会议服务,所述混音列表中数据标识的数量是所述会议控制平台根据预设混音深度确定的;
接收所述会议控制平台发送的N路音频数据,所述N路音频数据是指接入所述在线会议的所有与会终端对应的音频数据,N大于或等于2;
从所述N路音频数据中获取所述数据标识指示的所述至少两路音频数据。
7.根据权利要求1所述的方法,其特征在于,所述获取所述目标音频数据对应的第一文本数据之后,还包括:
在所述在线会议结束后,获取所述在线会议的其他音频数据,所述其他音频数据是指所述至少两路音频数据中除所述目标音频数据以外的音频数据;
获取所述其他音频数据对应的第二文本数据;
将所述第一文本数据与所述第二文本数据按照时间顺序合并,得到所述在线会议对应的文本文件。
8.一种基于在线会议的音频处理设备,其特征在于,所述设备包括处理器和存储器;所述存储器中存储有程序,所述程序由所述处理器加载并执行以实现如权利要求1至7任一项所述的基于在线会议的音频处理方法。
9.一种计算机可读存储介质,其特征在于,所述存储介质中存储有程序,所述程序被处理器执行时用于实现如权利要求1至7任一项所述的基于在线会议的音频处理方法。
10.一种基于在线会议的音频处理系统,其特征在于,所述系统包括N个与会终端、与每个与会终端通信相连的会议控制平台、以及与所述会议控制平台相连的会议智能服务器;所述N个与会终端接入同一在线会议,所述N为大于1的整数;
所述N个与会终端中的每个与会终端,用于在在线会议进行过程中采集音频数据,得到N路音频数据;将所述N路音频数据发送至所述会议控制平台;
所述会议控制平台,用于接收所述N路音频数据,并将所述N路音频数据转发至所述会议智能服务器;
所述会议智能服务器,用于在在线会议进行过程中,获取至少两个与会终端的音频数据;从至少两路音频数据中确定主要发言人对应的一路目标音频数据;并获取所述目标音频数据对应的第一文本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州科达科技股份有限公司,未经苏州科达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110729223.1/1.html,转载请声明来源钻瓜专利网。