[发明专利]音频标注方法、装置、设备及计算机可读存储介质有效
申请号: | 202010371102.X | 申请日: | 2020-04-30 |
公开(公告)号: | CN111629267B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 蒋亚雄;刘洪 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04N21/472 | 分类号: | H04N21/472;H04N21/8543;G06F16/783;G10L17/04 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 叶虹 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 标注 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种音频标注方法,其特征在于,包括:
显示音频标注界面,所述音频标注界面上的不同区域中分别显示有标注对象的身份信息、包含有所述标注对象的视频以及与所述视频的音频播放进度相对应的音频图形;
同步播放所述视频和所述音频图形,并在所述音频图形中检测与所述标注对象的身份信息相匹配的音频时段;
从所述视频对应的音频数据中获取所述音频时段对应的音频,并根据所述音频时段对应的音频以及所述标注对象的身份信息生成音频标注语料;
其中,所述同步播放所述视频和所述音频图形,并在所述音频图形中检测与所述标注对象的身份信息相匹配的音频时段,包括:
同步播放所述视频和所述音频图形;
在显示所述标注对象的身份信息,并同步播放所述视频和所述音频图形的过程中,若检测到音频选择指令,则根据所述音频选择指令在所述音频图形中定位音频时段的开始位置和结束位置;将位于所述开始位置和所述结束位置之间的音频时段确定为与所述标注对象的身份信息相匹配的音频时段。
2.根据权利要求1所述的方法,其特征在于,同步播放所述视频和所述音频图形,包括:
当检测到视频播放指令时,同步播放所述视频和所述音频图形。
3.根据权利要求1所述的方法,其特征在于,根据所述音频选择指令在所述音频图形中定位音频时段的开始位置和结束位置,包括:
在第奇数次检测到所述音频选择指令时,将所述音频图形中显示的实时播放进度点确定为所述开始位置;
在第偶数次检测到所述音频选择指令时,将所述音频图形中显示的实时播放进度点确定为与前一次检测到所述音频选择指令时确定的开始位置相对应的结束位置。
4.根据权利要求1所述的方法,其特征在于,显示与所述视频的音频播放进度相对应的音频图形,包括:
获取所述视频对应的音频采样率数据;
根据所述音频采样率数据绘制与所述视频的音频播放进度相对应的音频图形。
5.根据权利要求1述的方法,其特征在于,所述音频图形包括音频波形图,所述音频波形图用于显示所述视频的音频采样率波动情况以及音频播放进度。
6.根据权利要求1所述的方法,其特征在于,显示标注对象的身份信息以及包含有所述标注对象的视频,包括:
获取标注对象的身份信息,以及包含有所述标注对象的视频数据;
分别将所述标注对象的身份信息以及所述视频数据配置为与各自的数据类型相匹配的HTML标签;
根据所述HTML标签执行所述标注对象的身份信息的显示,以及包含有所述标注对象的视频的显示。
7.根据权利要求6所述的方法,其特征在于,获取标注对象的身份信息,以及包含有所述标注对象的视频数据,包括:
检测输入的标注对象标识;
根据检测到的标注对象标识以及进行音频标注的账号信息向服务端发起数据查询请求;
接收所述服务端根据所述数据查询请求所返回的查询结果,所述查询结果中含有与所述标注对象标识对应的视频数据以及身份信息。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从预先收集的视频中截取含有说话人画面的目标图像;
将所述说话人作为所述视频中含有的标注对象,并将所述目标图像作为所述标注对象的身份信息。
9.根据权利要求8所述的方法,其特征在于,从预先收集的视频中截取含有说话人画面的目标图像,包括:
对预先收集的各个视频进行人脸识别,确定含有人脸特征的视频;
从所述含有人脸特征的视频中截取所述目标图像。
10.根据权利要求1所述的方法,其特征在于,根据所述音频时段对应的音频以及所述标注对象的身份信息生成音频标注语料,包括:
获取所述音频时段对应的音频数据;
将所述音频数据与所述标注对象的身份信息进行关联存储,获得所述音频标注语料。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010371102.X/1.html,转载请声明来源钻瓜专利网。