[发明专利]一种基于语义压缩的水声语音数字传输方法在审
申请号: | 202110595072.5 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113395116A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 赵瑞琴;解伟亮;申晓红;陈帆;王超;杨港;锁健 | 申请(专利权)人: | 西北工业大学;西北工业大学深圳研究院 |
主分类号: | H04B13/02 | 分类号: | H04B13/02;G06F40/30;G10L13/02;G10L15/26;G10L19/00 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 金凤 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 压缩 语音 数字 传输 方法 | ||
本发明提供了一种基于语义压缩的水声语音数字传输方法,构建出语音‑语义库,将语音‑语义库分别输入通信机的语音传输模块中,用户通过麦克风说出想要发送的语音信息,通信机S的语音传输模块识别到语音输入后,完成语义压缩处理得到的语义压缩代码串,并发送至接收端,在接收端通过声音播放设备播放自发送端语音传输模块成功识别的语音信息,完成语义匹配。本发明大大压缩单条语音的传输数据量,有效降低对传输带宽的要求,克服抗干扰差、易失真等缺陷,减少由于水声信道带宽严重受限而产生的码间干扰的影响,提高了语音传输过程的稳定性,大大降低数字语音传输对水声信道带宽的要求,同时也有效降低了传输能耗。
技术领域
本发明涉及水声语音通信领域,涉及水声学,水声通信等,具体是一种水声数字语音传输方法。
背景技术
在人类步入21世纪的今天,海洋作为地球上的一个特殊空间,无论是它的物质资源价值,或是政治经济价值,都远远超出人们原有的认识。伴随着科学技术的不断发展,使人类能够有条件走向海洋、探索海洋。由于无线电波和光波在海水介质中的衰减速度很快,必须利用声波才能实现远距离的水声通信,因此,水声通信技术得到了充分的发展,这是实现水声语音通信的必要组成部分,为水声语音信息的顺利传输提供保障,也是当前海洋科技研究中的关键技术之一。
水声语音通信是一种最重要和最直接的水下通信方式,这使得人们对水下语音通信技术的研究更加迫切。水声语音通信技术最初应用于军事领域,随着人类海洋活动的增加和对海洋资源利用程度的提高,水声语音通信技术开始应用于民用领域,为海洋科考、资源勘探及潜水等提供服务。
水下语音通信可分为模拟和数字两种调制方式。由于海洋环境的复杂性与水声信道的特殊性,水声信道带宽非常有限。由于数字语音通信对信道带宽有着极高的要求,为实现正常语速的水下语音传输,现有的水声语音通信设备大多模拟单边带调制技术,比如美国海军使用的AN/WQC-2A单边带语音通信机、WHOI研制的模拟调频水声通信样机等,但模拟调制的通信方式受海洋水文环境的影响很大,难以克服浅海水声信道的时变强、多径干扰、带宽受限严重及多普勒效应影响,使得通信的误码率很高,工作距离很短,无法减小水声信道的衰落引发的信号畸变,从而语音通信质量难以保证。而且,由于采用模拟调制方式,使得系统功率利用效率相对较低。数字语音通信具有传输距离远、语音传输质量高的优势,是陆地电磁波传输环境下被广泛的采用的传输技术。然而,在复杂恶劣的海洋水声信道面临严重的多径效应与多普勒效应,通信接收端通常需使用复杂的自适应时域信道均衡和纠错编码技术,系统实现较为复杂;更为严峻的是,数字语音传输需要高的传输带宽,而中远程的水声信道带宽很低,无法为高质量的数字语音传输提供保障,这也是目前水下语音传输大多采用模拟调制的主要原因。
发明内容
为了克服现有技术的不足,本发明提供一种基于语义压缩的水声语音数字传输方法。为了在恶劣水声信道中获得传输距离远、质量高以及语音可懂度高的传输性能,本发明提出了一种具有低带宽要求的水声数字语音传输方法。该方法基于智能语义学习,大大压缩语音传输对水声信道带宽的要求,旨在复杂恶劣、时变空变水声信道中构建并实现稳健、可靠、高可懂度的水声语音中远程传输。
本发明解决其技术问题所采用的技术方案的详细步骤如下:
步骤1:有两套水声通信机S、R欲进行语音传输,其中S为发送端,R为接收端;通过离线自学习,对工作场景需要使用的语音文本信息进行特征提取处理,提取语音数据的语义特征,并建立各语音信息及其语义特征的压缩映射关系,压缩映射关系为语音文本信息—语义特征ID,通过压缩映射关系构建出适用于该工作场景下的语音-语义库,初步完成语音数据的高效压缩。语音-语义库构建流程图如图2所示。
步骤2:语音-语义库构建完成后,将步骤1构建好的语音-语义库分别输入到S、R两套通信机的语音传输模块中,使S、R两套通信机均能够通过步骤1中设定好的语音-语义库识别语音-语义库中包含的语音信息,以确保语音传输顺利进行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学;西北工业大学深圳研究院,未经西北工业大学;西北工业大学深圳研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110595072.5/2.html,转载请声明来源钻瓜专利网。