[发明专利]一种基于语义压缩的水声语音数字传输方法在审
申请号: | 202110595072.5 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113395116A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 赵瑞琴;解伟亮;申晓红;陈帆;王超;杨港;锁健 | 申请(专利权)人: | 西北工业大学;西北工业大学深圳研究院 |
主分类号: | H04B13/02 | 分类号: | H04B13/02;G06F40/30;G10L13/02;G10L15/26;G10L19/00 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 金凤 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 压缩 语音 数字 传输 方法 | ||
1.一种基于语义压缩的水声语音数字传输方法,其特征在于包括下述步骤:
步骤1:有两套水声通信机S、R欲进行语音传输,其中S为发送端,R为接收端;通过离线自学习,对工作场景需要使用的语音文本信息进行特征提取处理,提取语音数据的语义特征,并建立各语音信息及其语义特征的压缩映射关系,压缩映射关系为语音文本信息—语义特征ID,通过压缩映射关系构建出适用于该工作场景下的语音-语义库,初步完成语音数据的高效压缩;
步骤2:语音-语义库构建完成后,将步骤1构建好的语音-语义库分别输入到S、R两套通信机的语音传输模块中,使S、R两套通信机均能够通过步骤1中设定好的语音-语义库识别语音-语义库中包含的语音信息,以确保语音传输顺利进行;
步骤3:在发送端,用户通过麦克风说出想要发送的语音信息,通信机S的语音传输模块识别到语音输入后,完成语义压缩;
步骤4:经过步骤3中的语义压缩处理得到的语义压缩代码串为一组数据包P,通过通信机S将该数据包P发送至接收端;
步骤5:在接收端通过声音播放设备播放自发送端语音传输模块成功识别并通过通信机S成功传输到通信机R的语音信息,通信机R接收到数据包后,完成语义匹配。
2.根据权利要求1所述的基于语义压缩的水声语音数字传输方法,其特征在于:
所述语音-语义库容量为X个,X为正整数,X的取值依据实际应用场景所需语音文本信息的数量进行设定。
3.根据权利要求1所述的基于语义压缩的水声语音数字传输方法,其特征在于:
所述语音压缩为执行如下判断:
若该语音属于步骤1中构建的语音-语义库内容,则提取该语音信息的语义特征ID,接着对提取出的语义特征ID进行重新配对,得到语音传输模块能够识别的语义压缩代码串;
若该语音不属于语音-语义库内容,将抛弃该输入语音,等待新的语音输入。
4.根据权利要求1所述的基于语义压缩的水声语音数字传输方法,其特征在于:
所述步骤4中,数据包P包括帧标识头、发送端ID、各语音文本信息相应语义特征ID、接收端ID和帧结尾。
5.根据权利要求1所述的基于语义压缩的水声语音数字传输方法,其特征在于:
所述语义匹配为执行如下判断:
首先判断发送端ID与接收端ID是否匹配,若匹配,则对接收到的数据包进行语义恢复解码处理,通信机R的语音传输模块对此语音文本信息进行语音合成处理,合成为中文音频,之后通过声音播放设备将合成后的中文音频播报出来;若不匹配,该数据包将被抛弃,然后重新切换到接收模式,等待接收新的传输数据包。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学;西北工业大学深圳研究院,未经西北工业大学;西北工业大学深圳研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110595072.5/1.html,转载请声明来源钻瓜专利网。