[发明专利]一种音频比对方法、装置及设备有效
申请号: | 201911128304.5 | 申请日: | 2019-11-18 |
公开(公告)号: | CN110853676B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 李浩;骆明顺 | 申请(专利权)人: | 广州国音智能科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王兆林 |
地址: | 510000 广东省广州市黄埔*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 方法 装置 设备 | ||
本申请公开了一种音频比对方法、装置及设备,包括:获取待识别音频;对待识别音频中需要翻译的时间段进行标注;将标注后的音频生成所需的音频格式;获取音频格式的音频,任选标注部分进行比对。本申请通过对需要翻译的时间段进行标注的方式减少了需要比对的内容,降低了比对时长。
技术领域
本申请涉及音频识别技术领域,尤其涉及一种音频比对方法、装置及设备。
背景技术
在公安和司法领域的嫌疑人声纹识别中,在无法通过系统自动识别或者案情特殊的情况下,可能需要专家人工对检材语音和样本语音进行对比分析,得出两份语音是否同属一人的定论。
然而,采用上述的方式将整段的录音材料给到专家从头到尾全部对比,所需要花费的精力巨大,且时间耗费较长;另外当嫌疑人有口音或者方言的时候,专家听不懂的情况下回影响判断结果,需要翻译人员与专家一起进行对比工作或者需要翻译人员记录后给专家,不够便利。
发明内容
本申请实施例提供了一种音频比对方法、装置及设备,使得减少了需要比对的内容,降低了比对时长。
有鉴于此,本申请第一方面提供了一种音频比对方法,所述方法包括:
获取待识别音频;
对所述待识别音频中需要翻译的时间段进行标注;
将所述标注后的音频生成所需的音频格式;
获取所述音频格式的音频,任选标注部分进行比对。
优选地,所述待识别音频为嫌疑人的音频。
优选地,所述对所述待识别音频中需要翻译的时间段进行标注具体为:
对音频中的方言部分或者录音情景部分或者嫌疑人情绪部分进行标注。
优选地,所述对所述待识别音频中需要翻译的时间段进行标注,其标注的粒度为句子和/或词语和/或单个文字和/或单个音节和/或单个音素。
优选地,在所述获取待识别音频之后还包括:
采用语音识别技术对音频进行识别,将未能翻译成功的部分作为所述需要翻译的时间段。
优选地,所述音频格式为Wavf音频格式,包括文件头、pcm数据以及文字内容标记信息。
优选地,所述文字内容标记信息中包括内容标记符,内容标记符包括的信息为:开始时间、结束时间、音频具体内容。
本申请第二方面提供一种音频比对装置,所述装置包括:
音频获取单元,用于获取待识别音频;
音频标注单元,对所述待识别音频中需要翻译的时间段进行标注;
格式生成单元,用于将所述标注后的音频生成所需的音频格式;
音频比对单元,用于获取所述音频格式的音频,任选标注部分进行比对。
优选地,还包括:音频识别单元,用于采用语音识别技术对音频进行识别,将未能翻译成功的部分作为所述需要翻译的时间段。
本申请第三方面提供一种音频比对设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的音频比对的方法的步骤。
本申请中,提供了一种音频比对方法,包括:获取待识别音频;对所述待识别音频中需要翻译的时间段进行标注;将所述标注后的音频生成所需的音频格式;获取所述音频格式的音频,任选标注部分进行比对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州国音智能科技有限公司,未经广州国音智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911128304.5/2.html,转载请声明来源钻瓜专利网。