[发明专利]一种用于管理音频数据的方法、设备和计算机存储介质有效
申请号: | 201811180036.7 | 申请日: | 2018-10-10 |
公开(公告)号: | CN111107380B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 赵斯禹 | 申请(专利权)人: | 北京默契破冰科技有限公司 |
主分类号: | H04N21/2187 | 分类号: | H04N21/2187;H04N21/439;H04N21/433;H04N21/488;G10L17/00;G10L15/06;G10L15/00 |
代理公司: | 北京世辉律师事务所 16093 | 代理人: | 王俊 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 管理 音频 数据 方法 设备 计算机 存储 介质 | ||
本公开的实施例涉及用于管理音频数据的方法、设备和计算机存储介质。在一个实施例中,提出了一种用于管理音频数据的方法。该方法包括:获取文本敏感词的标准语音波形;基于与干扰因素相对应的语音数据,获得该标准语音波形的至少一个扩展语音波形,其中该至少一个扩展语音波形和该标准语音波形形成与该文本敏感词相对应的敏感词语音波形组;在直播间的直播期间,缓存该直播间的用户在最近的第一时间段期间的目标音频;获取该目标音频的音频波形;响应于确定该音频波形中存在与该敏感词语音波形组中的波形相匹配的部分,增加该直播间的敏感度值;以及响应于该直播间的该敏感度值达到敏感度阈值,针对该直播间执行屏蔽动作。
技术领域
本公开的实施例涉及音频处理领域,并且更具体地涉及用于管理音频数据、尤其是用于管理网络直播间中的音频数据的方法、设备和计算机存储介质。
背景技术
随着即时网络通信技术和智能手机的持续迅猛发展,出现了众多拥有网络直播功能的PC端和手机端的应用。由于网络直播能够极大地促进用户之间的沟通和互动,因此已经在娱乐休闲、远程教学、商务推广等方面得到了广泛使用。为了防止不良言论在大量用户中的传播,需要针对直播中的各种内容执行监测。然而,通常需要大量的后台管理员或审核员对直播数据进行人工监测,以便及时屏蔽违规内容或进行封禁处理等,直播中的语音监测在拥有众多直播数据的应用平台上难以高效地进行。
此外,虽然目前已经提出了针对视频中的音频数据进行自动识别以检测是否包含敏感词汇的实现方案,但是这些方案往往无法对存在方言口音、语调、情感等干扰因素的音频数据进行准确的判断,因而降低了识别的命中率。
发明内容
本公开的实施例提供一种用于自动且准确地管理音频数据的方案。
根据本公开的第一方面,提供了一种用于管理音频数据的方法,包括:获取文本敏感词的标准语音波形;基于与干扰因素相对应的语音数据,获得该标准语音波形的至少一个扩展语音波形,其中该至少一个扩展语音波形和该标准语音波形形成与该文本敏感词相对应的敏感词语音波形组;在直播间的直播期间,缓存该直播间的用户在最近的第一时间段期间的目标音频;获取该目标音频的音频波形;响应于确定该音频波形中存在与该敏感词语音波形组中的波形相匹配的部分,增加该直播间的敏感度值;以及响应于该直播间的该敏感度值达到敏感度阈值,针对该直播间执行屏蔽动作;其中该干扰因素包括以下中的至少任一项:方言口音、语调、语速、性别、以及情感。
根据本公开的第二方面,提供了一种用于管理音频数据的设备,包括:至少一个处理单元;至少一个存储器,该至少一个存储器被耦合到该至少一个处理单元并且存储用于由该至少一个处理单元执行的指令,该指令当由该至少一个处理单元执行时,使得该设备执行动作。该动作包括:获取文本敏感词的标准语音波形;基于与干扰因素相对应的语音数据,获得该标准语音波形的至少一个扩展语音波形,其中该至少一个扩展语音波形和该标准语音波形形成与该文本敏感词相对应的敏感词语音波形组;在直播间的直播期间,缓存该直播间的用户在最近的第一时间段期间的目标音频;获取该目标音频的音频波形;响应于确定该音频波形中存在与该敏感词语音波形组中的波形相匹配的部分,增加该直播间的敏感度值;以及响应于该直播间的该敏感度值达到敏感度阈值,针对该直播间执行屏蔽动作;其中该干扰因素包括以下中的至少任一项:方言口音、语调、语速、性别、以及情感。
在本公开的第三方面,提供了一种计算机存储介质。该计算机存储介质具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行根据第一方面的方法。
提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或必要特征,也无意限制本公开的范围。
附图说明
通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的附图标记通常代表相同部件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京默契破冰科技有限公司,未经北京默契破冰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811180036.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置