[发明专利]一种远程会议语音识别数据传输方法在审
申请号: | 201811323511.1 | 申请日: | 2018-11-08 |
公开(公告)号: | CN109525800A | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 何镝;诸健文;胡红林;周骋 | 申请(专利权)人: | 江西国泰利民信息科技有限公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15;H04N21/439;H04N21/4402;G10L15/22;G10L15/26;G10L17/04;G10L17/06;G10L21/0208;G10L21/0216 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 330000 江西省南昌市南昌高新技术产*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种远程会议语音识别数据传输方法,包括若干个参会终端设备,每个参会终端设备包括麦克风阵列、摄像头、wifi模块、语音处理模块、声纹训练模块、存储模块、语音识别服务器、中央处理器、扬声器和显示屏,所述语音处理模块分别连接声纹训练模块和麦克风阵列,所述中央处理器分别连接存储模块、摄像头、wifi模块、扬声器和显示屏,所述Wifi模块通过互联网连接语音识别服务器。本发明不仅构建了远程视频会议,还通过语音识别将会议上发言人的语音进行处理,并转换成文档进行存储,通过声纹识别确认发音人的身份,并对会议中不同的发言人进行身份记录。 | ||
搜索关键词: | 语音识别 扬声器 语音识别服务器 语音处理模块 麦克风阵列 中央处理器 摄像头 存储模块 声纹训练 数据传输 远程会议 终端设备 显示屏 远程视频会议 互联网连接 身份记录 声纹识别 构建 文档 发音 存储 语音 会议 转换 身份 | ||
【主权项】:
1.一种远程会议语音识别数据传输方法,包括若干个参会终端设备,每个参会终端设备包括麦克风阵列、摄像头、wifi模块、语音处理模块、声纹训练模块、存储模块、语音识别服务器、中央处理器、扬声器和显示屏,所述语音处理模块分别连接声纹训练模块和麦克风阵列,所述中央处理器分别连接存储模块、摄像头、麦克风阵列、wifi模块、扬声器和显示屏,所述Wifi模块通过互联网连接语音识别服务器,其特征在于,该方法包括构建远程视频会议和生成会议记录文档,其中,构建远程视频会议包括以下步骤:步骤1.1)多个参会终端设备同步运行,打开显示屏,并开启摄像头和麦克风阵列分别对现场会议视频和音频进行拾取;步骤1.2)摄像头捕捉视频画面传送到对应参会终端设备的中央处理器进行编解码,麦克风阵列搜集语音,一份传送至对应参会终端设备的中央处理器进行编解码,另一份传送至语音处理模块进行声纹特征对比以及降噪去回音;步骤1.3)参会终端设备的中央处理器将编解码后的视频画面和语音通过wifi模块连接互联网传送至其它参会终端设备进行解码,解码后的视频画面通过显示器显示,解码后的语音通过扬声器播放,实现远程视频会议;生成会议记录文档包括以下步骤:步骤2.1)语音处理模块对步骤1.2)中传输来的语音流进行声纹特征对比、降噪、去回声处理,声纹训练模块从语音处理模块调用处理过的语音流进行处理并返回给语音处理模块建立声纹角色数据库;步骤2.2)语音处理模块将处理后的语音流通过wifi模块上传至语音识别服务器进行识别转码,并生成会议记录文档;步骤2.3)语音识别服务器将生成的会议记录文档回传至语音处理模块;步骤2.4)语音处理模块通过中央处理器将生成的会议记录文档根据保存地址进行存储。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西国泰利民信息科技有限公司,未经江西国泰利民信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811323511.1/,转载请声明来源钻瓜专利网。