[发明专利]视频会议自动补音的方法、系统、存储介质及电子设备有效

申请号：	202010962350.1	申请日：	2020-09-14
公开（公告）号：	CN112270919B	公开（公告）日：	2022-11-22
发明（设计）人：	李璐;陈洪浩;冯文澜	申请（专利权）人：	深圳随锐视听科技有限公司;随锐科技集团股份有限公司
主分类号：	G10L13/08	分类号：	G10L13/08;G10L15/26;H04L65/80;H04N21/439;H04N21/8547
代理公司：	北京兴智翔达知识产权代理有限公司 11768	代理人：	张玉梅
地址：	518000 广东省深圳市南山区粤海街道高新区社区***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频会议自动方法系统存储介质电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种视频会议自动补音的方法、系统、存储介质及电子设备，其中视频会议自动补音的方法包括：发送端麦克风拾音形成音频流数据包；发送端开启语音识别功能，将音频流数据包转为文字信息包；接收端同时接收音频流数据包及文字信息包；接收端对音频流数据包进行检测，判断音频流数据包是否丢包；当发生丢包时，接收端将已接收的音频流数据包的时间戳与已接收的文字信息包的时间戳进行比对，找到音频流数据包丢包区域相对应的文字信息包；接收端开启语音合成功能，将与丢包区域相对应的文字信息包生成音频数据。借此，本发明的视频会议自动补音的方法、系统、存储介质及电子设备，可以对丢失音频智能还原，且自动补全。

技术领域

本发明是关于视频多媒体通信技术领域，特别是关于一种视频会议自动补音的方法、系统、存储介质及电子设备。

背景技术

视频会议、指挥调度过程中，目前基于网络变化导致音频丢失情况，主要采用音频前向纠错，加到音频冗余等算法，保障在一定网络损伤的情况下保障音频质量。

以上方案号称支持网络丢包率30％的情况下音频能够保持流畅。但是存在对带宽要求高，而往往丢包率高的环境，带宽普遍偏低无法满足音频流畅的需求。

现有技术方案主要侧重点在于尽可能的通过智能算法自动补充部分音频数据或者发送更多的音频数据，确保即使丢失部分也不影响整体效果。智能算法自动补充只能解决丢失一两个数据包的情况，而发送更多冗余包的做法会增加网络带宽，对带宽要求高。

公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。

发明内容

本发明的目的在于提供一种视频会议自动补音的方法、系统、存储介质及电子设备，其能够对丢失音频智能还原，且自动补全。

为实现上述目的，本发明一方面提供了一种视频会议自动补音的方法、系统、存储介质及电子设备，其中视频会议自动补音的方法包括：发送端麦克风拾音形成音频流数据包；发送端开启语音识别功能，将音频流数据包转为文字信息包；接收端同时接收音频流数据包及文字信息包；接收端对音频流数据包进行检测，判断音频流数据包是否丢包；当发生丢包时，接收端将已接收的音频流数据包的时间戳与已接收的文字信息包的时间戳进行比对，找到音频流数据包丢包区域相对应的文字信息包；接收端开启语音合成功能，将与丢包区域相对应的文字信息包生成音频数据；将音频数据补充至丢包的音频流数据包相对应的时间戳中。

在本发明的一实施方式中，接收端对所述音频流数据包进行检测，判断所述音频流数据包是否丢包包括：预设时间内未收到音频流数据包，则判断音频流数据包发生预设丢包；预设时间内接收到音频流数据包，当音频流数据包的丢包数量超过丢包预设值时，则判断音频流数据包发生预设丢包。

在本发明的一实施方式中，音频流数据包的丢包预设值为三个。

在本发明的一实施方式中，生成音频数据的时间范围小于丢包起始时间，大于丢包结束时间。

在本发明的一实施方式中，将音频数据补充至丢包的音频流数据包相对应的时间戳中包括：截取生成音频数据中与丢包的音频流数据包相对应的音频数据，补充至丢包的音频流数据包相对应的时间戳中。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳随锐视听科技有限公司;随锐科技集团股份有限公司，未经深圳随锐视听科技有限公司;随锐科技集团股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010962350.1/2.html，转载请声明来源钻瓜专利网。

上一篇：一种位置可调的铝合金搅拌摩擦焊的工装夹具
下一篇：一种可进行太阳能充电的电源

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]视频会议自动补音的方法、系统、存储介质及电子设备有效

专利文献下载