[发明专利]一种基于声纹特征及语义压缩的水声语音数字通信方法在审

申请号：	202111598552.3	申请日：	2021-12-24
公开（公告）号：	CN114387976A	公开（公告）日：	2022-04-22
发明（设计）人：	申晓红;王超;赵瑞琴;陈帆;解伟亮	申请（专利权）人：	西北工业大学
主分类号：	G10L17/04	分类号：	G10L17/04;G10L15/18;G10L17/02;G10L19/00
代理公司：	西北工业大学专利中心 61204	代理人：	金凤
地址：	710072 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于声纹特征语义压缩语音数字通信方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于声纹特征及语义压缩的水声语音数字通信方法，其特征在于包括下述步骤：

步骤1：通过设备对用户的声纹进行学习并建模，并根据声纹为不同用户分配不同的声纹身份ID_v∈{1,...,I}，从而得到一一对应于不同用户的不同声纹特征模型，使设备能够识别某段语音来自于哪一已知用户或不属于已知用户；

步骤2：使不同用户按照需求所预定义的语音内容库输入语音k，语音内容库的语音内容容量为K，k∈{1,...,K}，设备对语义特征m_ki及声纹特征v_ki进行提取，完成对语义特征及声纹特征的特征匹配，从而使输入的语音与各用户建立匹配关系，并记录入语义-声纹库L；

步骤3：在对输入语音建立语义特征及声纹特征的匹配关系的同时，提取该语音的语速特征s_j，j∈{1,...,J}，建立语速模型；并对语义-声纹库与语速特征进行模式拟合，得到语音对应的拟合特征y＝f(m_ki,v_ki,s_j)，i∈{1,...,I}，k∈{1,...,K}，j∈{1,...,J}；

步骤4：模式拟合完成后，建立语音的压缩映射关系；

当有语音输入时，若该语音属于语义-声纹库，则提取该语音的语速特征，并结合其语义-声纹为语音分配压缩代码N_y，拟合特征y分配唯一的压缩代码N_y，y∈{1,...,I×K×J}，记录语音及对应的压缩代码入压缩代码库，从而建立了各用户、各语音内容及语速的完整的压缩映射关系；否则抛弃该输入语音，等待新的语音输入；

步骤5：压缩映射关系建立完成后，当输入端有语音输入时，首先判断该语音是否属于语义-声纹库L：若语音属于语义-声纹库L，则对该语音进行语义、声纹及语速的提取，得到用户身份ID_v，并进行语音压缩，得到压缩代码；否则，抛弃该输入语音，等待新的语音输入；

步骤6：语音压缩完成后，将压缩代码打包成数据包p，数据包p由发送端身份ID_t∈{1,...,I}，接收端身份ID_r∈{1,...,I}，用户身份ID_v及语音所对应的压缩代码构成，并发送数据包p至接收端；发送端身份ID_t与用户身份ID_v含义不同，发送端身份ID_t表征了该用户在通信网络中的ID号，而用户身份ID_v表征了该用户的声纹ID号；

步骤7：当接收端接收到数据包后，首先判断包头中用户身份IDv与压缩代码库中Ny对应的声纹信息是否匹配：若匹配，则对接收到的数据进行解压缩，得到压缩代码对应的语音的语义、声纹及语速信息，进而进行语音的播报；否则，该数据包视为语音特征不匹配，抛弃该数据包。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西北工业大学，未经西北工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111598552.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于多机头的自动仿铜拉丝机
下一篇：一种聚苯并咪唑离子型共价有机框架材料BM-S及其制备方法和应用

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于声纹特征及语义压缩的水声语音数字通信方法在审

专利文献下载