[发明专利]基于声纹的音频输出方法、装置、设备及可读存储介质有效

申请号：	201910981040.1	申请日：	2019-10-15
公开（公告）号：	CN110767229B	公开（公告）日：	2022-02-01
发明（设计）人：	郑琳琳;陈昊亮;曹虎	申请（专利权）人：	广州国音智能科技有限公司
主分类号：	G10L15/25	分类号：	G10L15/25;G10L17/04;G10L17/06;H04N7/15;G06F3/16
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	张婷
地址：	510000 广东省广州市黄埔***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于声纹音频输出方法装置设备可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于声纹的音频输出方法，该方法包括：当接收到音频信息时，获取所述音频信息中的声纹信息，并在声纹数据库中查找与所述声纹信息对应的声纹样本；判断音频数据库中是否存在与所述音频信息对应的音频样本；若所述音频数据库中不存在与所述音频信息对应的音频样本，则向视频识别装置输出唇形获取指令，以获取目标唇形；根据所述目标唇形和所述声纹样本生成目标音频，并将所述目标音频输出。本发明还公开了一种基于声纹的音频输出装置、设备及可读存储介质。本发明实现了在周边环境等不可控因素影响的情况下，提高了音频播放的质量。

技术领域

本发明涉及语音处理领域，尤其涉及一种基于声纹的音频输出方法、装置、设备及可读存储介质。

背景技术

随着办公智能化的快速发展，由于不受地域限制，可以容纳更多的人员，视频会议被越来越多地运用在办公中。

现有的视频会议中，发言人在发言时，很容易受到自身及周围环境的影响，从而造成播出的声音音质嘈杂，音量大小变化，从而导致收听发言的人员参会体验下降，影响视频会议的效果，在受到发言人自身及周边环境等不可控因素的影响下，如何使视频会议播放的声音质量得到提高成为了亟待解决的技术问题。

发明内容

本发明的主要目的在于提供一种基于声纹的音频输出方法，旨在解决在受到发言人自身及周边环境等不可控因素的影响下，使视频会议播放的声音质量得到提高的技术问题。

此外，为实现上述目的，本发明还提供一种基于声纹的音频输出方法，所述基于声纹的音频输出方法包括以下步骤：

当接收到音频信息时，获取所述音频信息中的声纹信息，并在声纹数据库中查找与所述声纹信息对应的声纹样本；

判断音频数据库中是否存在与所述音频信息对应的音频样本；

若所述音频数据库中不存在与所述音频信息对应的音频样本，则向视频识别装置输出唇形获取指令，以获取目标唇形；

根据所述目标唇形和所述声纹样本生成目标音频，并将所述目标音频输出。