[发明专利]音频信息处理方法、装置、电子设备及存储介质有效
申请号: | 201911053962.2 | 申请日: | 2019-10-31 |
公开(公告)号: | CN110767234B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 方迟;朱海舟;陈亮;潘洪 | 申请(专利权)人: | 抖音视界有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 徐晨影 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信息处理 方法 装置 电子设备 存储 介质 | ||
1.一种音频信息处理方法,包括:
接收针对电子设备的用户界面的音频处理指示输入,电子设备的用户界面包括文字可提取区域和文字不可提取区域,其中,针对所述文字可提取区域的文字提取输入与所述音频处理指示输入存在相互干扰;
确定是否满足录音开始条件,包括:
获取所述音频处理指示输入在所述电子设备的用户界面上的位置;
确定所述电子设备的用户界面在所述位置处是否属于文字可提取区域;以及
响应于确定所述电子设备的用户界面在所述位置处不属于文字可提取区域,
确定满足所述录音开始条件;
响应于确定满足所述录音开始条件,采集与电子设备相关联的音频信息,包括:
创建底层硬件通路;以及
响应于确定满足所述录音开始条件,通过所述底层硬件通路实时采集作为所述电子设备内部的音频信息的来自底层硬件的音频信息;
在采集与所述电子设备相关联的音频信息期间,实时识别与所述音频信息对应的文字信息;
在所述电子设备的用户界面上实时显示经实时识别的文字信息;
对与所述音频信息对应的文字信息进行分词,以获得经分词的文字信息;以及
在所述电子设备的用户界面上显示经分词的文字信息。
2.根据权利要求1所述的音频信息处理方法,其中,所述确定是否满足所述录音开始条件包括:响应于接收针对所述电子设备的用户界面的音频处理指示输入,确定满足所述录音开始条件。
3.根据权利要求1所述的音频信息处理方法,还包括:
接收针对所述电子设备的用户界面的音频处理指示输入,
其中,所述确定是否满足录音开始条件包括:
确定所述电子设备的用户界面在接收到所述音频处理指示输入时显示的是否为应用程序窗口;
响应于确定所述电子设备的用户界面在接收到所述音频处理指示输入时显示的是应用程序窗口,确定所述应用程序窗口是否允许被录音;以及
响应于确定所述应用程序窗口允许被录音,确定满足所述录音开始条件。
4.根据权利要求3所述的音频信息处理方法,其中,所述确定是否满足录音开始条件还包括:
响应于确定所述电子设备的用户界面在接收到所述音频处理指示输入时显示的不是应用程序窗口,确定满足所述录音开始条件。
5.根据权利要求2至4中任一项所述的音频信息处理方法,其中,所述接收针对所述电子设备的用户界面的音频处理指示输入包括:
接收针对所述电子设备的用户界面的功能菜单呼出输入;
响应于接收到所述功能菜单呼出输入,在所述电子设备的用户界面上显示功能选择菜单,其中,所述功能选择菜单包括音频分词功能选项;以及
接收针对所述音频分词功能选项的选择。
6.根据权利要求1所述的音频信息处理方法,其中,所述接收针对所述电子设备的用户界面的音频处理指示输入包括:
接收针对所述电子设备的用户界面的功能菜单呼出输入;
响应于接收到所述功能菜单呼出输入,在所述电子设备的用户界面上显示功能选择菜单,其中,所述功能选择菜单包括音频分词功能选项;以及
接收针对所述音频分词功能选项的输入。
7.根据权利要求6所述的音频信息处理方法,其中,所述获取所述音频处理指示输入在所述电子设备的用户界面上的位置包括:
获取所述功能菜单呼出输入在所述电子设备的用户界面上的位置。
8.根据权利要求1所述的音频信息处理方法,其中,所述采集与所述电子设备相关联的音频信息包括:
实时采集所述电子设备内部的音频信息;和/或
实时采集来自所述电子设备外部的音频信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于抖音视界有限公司,未经抖音视界有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911053962.2/1.html,转载请声明来源钻瓜专利网。