[发明专利]音频流实时回放方法、装置和电子设备在审
申请号: | 201811428809.9 | 申请日: | 2018-11-27 |
公开(公告)号: | CN109657092A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 彭捷;闫冬 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/63 | 分类号: | G06F16/63;G11B20/10 |
代理公司: | 深圳市立智方成知识产权代理事务所(普通合伙) 44468 | 代理人: | 王增鑫 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频流 节段 实时回放 有效音频 电子设备 回放 信息量 语音处理技术 内容信息量 存储介质 存储资源 回放操作 回放过程 获取内容 时间节点 实时处理 实时获取 音频处理 音频分析 音频文件 应用场景 原始音频 调取 减小 剔除 分割 检测 节约 | ||
本发明涉及音频处理和语音处理技术领域,公开一种音频流实时回放方法,包括:将实时获取的音频流分割为多个音频节段;检测各个音频节段的内容信息量;获取内容信息量大于或等于信息量阈值的音频节段,标记为有效音频节段;在回放过程中,根据用户的回放操作调取相应有效音频节段进行回放。本发明还提供一种音频流实时回放装置、电子设备及存储介质。本发明能在不影响原始音频流的前提下,实现实时回放和在指定时间节点的回放,还可剔除空白音频,能够适应现有的应用场景,解决前述技术问题。本发明对音频流中的空白音能实时处理,减小整段音频流形成音频文件大小,节约存储资源。本发明通过实时对音频流音频分析,用户能实时回放有效音频节段。
技术领域
本发明涉及音频处理领域,更具体地,涉及一种音频流实时回放方法、装置和电子设备。
背景技术
目前全球化、信息化的推进,需要使用各种各样的实时音频流数据,例如在远程授课的应用场景中,就会出现授课者和学习者的实时音频流。再举一个例子,在视像会议中就会出现与会人讨论问题、发表讲话等实时音频流。
在包括以上列举的各种场景中,经常出现语速过快或者重点内容需要重复收听便于理解的情景,此时由于是实时的音频流,无法实时回放。例如在另一些场景中,由于与会者或者学生某些情况下缺席,需要针对特定时间节点的音频流调取收听。此外,音频流中还包括一些空白音频等信息。受限于音频流连续不断的特性,不能实现实时回放和特定节点的调取收听,只能等待音频流结束,再将整一段音频回放。
现有技术中,一般是将整一段音频回放,但由于空白音频也占用了相当时间,导致用户需要等待,降低回放效率。
发明内容
鉴于上述问题,本发明提出了一种用于检索的方法和相应的装置,其在即使网络服务经常断网的情况下也能够通过选定的搜索服务器将基于检索请求的检索结果反馈给用户。
第一方面,本发明提供一种音频流实时回放方法,包括:
将实时获取的音频流分割为多个音频节段;
检测各个音频节段的内容信息量;
获取内容信息量大于或等于信息量阈值的音频节段,标记为有效音频节段;
在回放过程中,根据用户的回放操作调取相应的有效音频节段进行回放。
结合第一方面,所述将实时获取的音频流分割为多个音频节段的步骤之前,还包括:
获取实时的音频流;
对所述实时的音频流进行底噪滤波,滤除音频流中的环境噪声。
结合第一方面,所述将实时获取的音频流分割为多个音频节段的步骤,包括:
获取所述底噪滤波后的音频流,得到纯音频数据;
检测所述纯音频数据的波形特征,获取特征值大于空白音频的波形阈值的第一个时间节点作为起始点;
从所述起始点开始,将音频流分割为若干音频节段。
结合第一方面,所述音频流实时回放方法还包括:
对所述有效音频节段进行语音识别并转化为文本信息;
在回放过程中,将所述文本信息与用户调取有效音频节段同步进行展示。
结合第一方面,所述将实时获取的音频流分割为多个音频节段的步骤之前,还包括:
获取并解析所述纯音频数据的采集信息和声音特征信息,根据所述采集信息和声线波纹确定发声者;其中,所述采集信息包括采集位置和采集距离;
将所述发声者在纯音频数据中出现的时间节点,将发声者的身份标识添加到所述纯音频数据中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811428809.9/2.html,转载请声明来源钻瓜专利网。