[发明专利]音频帧的输出方法和装置有效

申请号：	202011225036.1	申请日：	2020-11-05
公开（公告）号：	CN112527234B	公开（公告）日：	2021-08-17
发明（设计）人：	李超	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06F3/16	分类号：	G06F3/16
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	白雪静
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频输出方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种音频帧的输出方法和装置，涉及语音技术和深度学习技术等人工智能技术领域，其中，方法包括：根据终端设备的内存占用标准值，确定终端设备对应的音频生成模型是否满足预设的休眠条件；在音频生成模型满足休眠条件的情况下，根据内存占用标准值确定音频生成模型的休眠时间间隔；根据音频生成模型的休眠时间间隔控制相邻音视频的生成时间间隔。由此，根据终端设备的内存占用要求，适配音频生成模型在音频输出时的内存占用率，兼顾了音频输出效率和内存占用率。

技术领域

本申请涉及语音技术和深度学习技术等人工智能技术领域，尤其涉及一种音频帧的输出方法和装置。

背景技术

随着人工智能技术的进步，音频生成模型作为根据输入的文本输出音频，成为终端设备在语音技术技术领域中的常用模型。比如，终端设备中的音频生成模型，根据系统生成的反馈文本，转换为语音进行播放，为用户提供“对话式”的人工智能服务。

相关技术中，如图1所示，音频生成模型连续生成音频帧，直至文本对应的音频帧输出完毕。

然而，音频生成模型在生成音频帧时，若是内存占用较大，当终端设备的内存无法匹配时，则会导致音频输出卡顿等。

发明内容

本申请提提供了一种用于避免音频帧输出卡顿的音频帧的输出方法和装置。

根据第一方面，提供了一种音频帧的输出方法，包括：根据终端设备的内存占用标准值，确定所述终端设备对应的音频生成模型是否满足预设的休眠条件；在所述音频生成模型满足所述休眠条件的情况下，根据所述内存占用标准值确定所述音频生成模型的休眠时间间隔；根据所述音频生成模型的休眠时间间隔控制相邻音频的生成时间间隔。

根据第二方面，提供了一种音频帧的输出装置，包括：第一确定模块，用于根据终端设备的内存占用标准值，确定所述终端设备对应的音频生成模型是否满足预设的休眠条件；第二确定模块，用于在所述音频生成模型满足所述休眠条件的情况下，根据所述内存占用标准值确定所述音频生成模型的休眠时间间隔；输出控制模块，用于根据所述音频生成模型的休眠时间间隔控制相邻音频的生成时间间隔。

根据第三方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述第一方面所述的音频帧的输出方法。

根据第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质所述计算机指令用于使所述计算机执行上述第一方面所述的音频帧的输出方法。

根据第五方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据第一方面所述的音频帧的输出方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请第一实施例的音频生成模型输出音频帧过程示意图；

图2是根据本申请第二实施例的音频生成模型输出音频帧过程示意图；

图3是根据本申请第三实施例的音频帧的输出方法的流程图；

图4是根据本申请第四实施例的音频帧的输出方法的流程图；

图5是根据本申请第五实施例的音频帧的输出方法的流程图；

图6是根据本申请第六实施例的音频帧的输出方法的流程图；