[发明专利]音频识别方法、装置、终端及存储介质在审
申请号: | 202010615325.6 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111768782A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 陈土亮;何越 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L17/02;G10L17/22;G10L25/51 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭翱杰 |
地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 识别 方法 装置 终端 存储 介质 | ||
本申请提供了一种音频识别方法、装置、终端及存储介质,属于计算机技术领域。所述方法包括:当接收到音频识别指令时,启动屏幕录制;获得在屏幕录制的过程中所述终端的音频转换单元接收到的音频数据;对所述音频数据进行识别,得到所述音频数据对应的音频信息。本申请基于屏幕录制过程中的数据调用权限,从本地获取需要识别的音频数据,进行音频识别,实现了终端未处于音频外放模式时对本地播放的音频的识别,扩展了音频识别的使用场景。
技术领域
本申请涉及计算机技术领域,特别涉及一种音频识别方法、装置、终端及存储介质。
背景技术
音频识别为用户提供了一种快速便捷的音乐搜索方式。用户在听到自己喜欢的音乐时,可以应用终端的音频识别功能,来快速获知音乐的相关信息。当前,终端只能对外部环境中采集到的音频,进行识别,将识别出的音频相关信息展示给用户。
当用户想要了解终端正在播放的音频的相关信息时,只有将终端调整为音频外放模式,才能使终端在外部环境中采集到正在播放的音频,进行音频识别。若终端通过耳机播放音频,也即未处于音频外放模式时,则无法在外部环境中采集到本地正在播放的音频,进而也无法进行音频识别。因此,亟需一种在终端未处于音频外放模式时对本地播放的音频进行识别的方法。
发明内容
本申请实施例提供了一种音频识别方法、装置、终端及存储介质,能够在终端未处于音频外放模式时,实现对本地播放的音频的识别。所述技术方案如下:
一方面,提供了一种音频识别方法,所述方法包括:
当接收到音频识别指令时,启动屏幕录制;
获得在屏幕录制的过程中所述终端的音频转换单元接收到的音频数据;
对所述音频数据进行识别,得到所述音频数据对应的音频信息。
在一种可能的实现方式中,所述当接收到音频识别指令时,启动屏幕录制,包括:
当接收到音频识别指令且音频播放模式为耳机播放模式时,启动屏幕录制。
在另一种可能的实现方式中,所述获得在屏幕录制的过程中所述终端的音频转换单元接收到的音频数据,包括:
获得所述终端的音频扩展程序接收到的音频数据;其中,所述音频扩展程序在屏幕录制的过程中具有对所述终端的音频转换单元接收到的音频数据的数据调用权限。
在另一种可能的实现方式中,所述当接收到音频识别指令时,启动屏幕录制之前,所述方法还包括:
显示目标客户端的音频识别界面,所述目标客户端为具有音频识别功能的客户端,所述音频识别界面包括音频识别控件,所述音频识别控件用于指示基于屏幕录制进行音频识别;
响应于对所述音频识别控件的交互操作,触发音频识别指令。
在另一种可能的实现方式中,所述当接收到音频识别指令时,启动屏幕录制之前,所述方法还包括:
显示系统功能界面,所述系统功能界面包括屏幕录制控件;
响应于对所述屏幕录制控件的交互操作,显示录制选项窗口,所述录制选项窗口包括音频扩展选项,所述音频扩展选项用于指示基于屏幕录制进行音频识别;
响应于对所述音频扩展选项的交互操作,触发音频识别指令。
在另一种可能的实现方式中,所述对所述音频数据进行识别,得到所述音频数据对应的音频信息,包括:
生成所述音频数据的声纹数据;
向服务器发送携带所述声纹数据的音频识别请求;
接收服务器基于所述声纹数据返回的所述音频数据对应的音频信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010615325.6/2.html,转载请声明来源钻瓜专利网。