[发明专利]一种录音过滤方法、装置及计算机可读存储介质在审
申请号: | 202010999917.2 | 申请日: | 2020-09-22 |
公开(公告)号: | CN112102854A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 严馨华 | 申请(专利权)人: | 福建鸿兴福食品有限公司 |
主分类号: | G11B20/10 | 分类号: | G11B20/10;G10L15/08;G10L15/26;G10L17/00;G10L21/0208;G10L25/51 |
代理公司: | 深圳市易美诺知识产权代理事务所(普通合伙) 44520 | 代理人: | 沈荣彬 |
地址: | 364000 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 录音 过滤 方法 装置 计算机 可读 存储 介质 | ||
本发明公开的录音过滤方法对第一录音进行语音识别分析;按照预设规则对所述第一录音进行过滤,得到第二录音;其中,所述预设规则包括:保留或过滤预设语音类型的录音,所述预设语音类型包括:人声、音乐、噪声;或者,保留或过滤满足预设条件的录音,所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。这样,本发明提供的录音过滤方法能够按照预设规则对录音进行过滤,过滤掉无效录音,仅保留有效录音,减少人工对录音进行回放识别的时间,提高录音回放识别的效率。
技术领域
本发明涉及录音处理技术领域,尤其涉及一种录音过滤方法、装置及计算机可读存储介质。
背景技术
随着电子产品的不断推广与电子技术的不断发展,在需要实时记录的场景(例如会议场景或者监控场景),人们通常会选择通过录音的方式进行记录,然后人工对录音文件进行回放,识别和筛选有效录音并由人工将其转化为文字。
由于录音文件的时长通常较长,且中间可能存在较多无效录音,人工对录音进行回放识别需要耗费较多的时间,效率较低。
发明内容
有鉴于此,本发明提出录音过滤方法、装置及计算机可读存储介质,以解决上述技术问题。
首先,为实现上述目的,本发明提出一种录音过滤方法,所述方法包括:
对第一录音进行语音识别分析;
按照预设规则对所述第一录音进行过滤,得到第二录音;
其中,所述预设规则包括:
保留或过滤预设语音类型的录音,所述预设语音类型包括:人声、音乐、噪声;
或者,保留或过滤满足预设条件的录音,所述预设条件包括预设年龄范围、预设性别、预设声纹特征参数中的至少一种。
可选地,所述对第一录音进行语音识别分析,包括:
对所述第一录音进行语音分类获得语音类型,所述语音类型包括:人声、噪声、音乐;
若所述语音类型是人声,则对所述第一录音进行声纹识别获取所述讲话者的声纹特征参数,和/或对所述第一录音进行讲话者的性别判断获取所述讲话者的性别,和/或对所述第一录音进行讲话者的年龄范围判断获取所述讲话者的年龄范围。
可选地,所述预设规则包括保留或过滤预设语音类型的录音,所述按照预设规则对所述第一录音进行过滤,包括:
保留第一预设语音类型的录音;
和/或,过滤第二预设语音类型的录音。
可选地,所述第一预设语音类型包括人声,和/或,所述第二预设语音类型包括音乐和/或噪声。
可选地,所述预设条件包括所述预设年龄范围;
所述保留或过滤满足预设条件的录音,包括:
判断所述第一录音中所述讲话者的年龄范围是否落入所述预设条件包括的所述预设年龄范围;
若所述第一录音中所述讲话者的年龄范围没有落入所述预设条件包括的所述预设年龄范围,保留或过滤所述讲话者的录音。
可选地,所述预设条件包括所述预设性别;
所述保留或过滤满足预设条件的语音,包括:
判断所述第一录音中所述讲话者的性别是否与所述预设条件包括的所述预设性别相同;
若所述第一录音中所述讲话者的所述性别与所述预设条件包括的所述预设性别相同,保留或过滤所述讲话者的录音。
可选地,所述预设条件包括所述预设声纹特征参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建鸿兴福食品有限公司,未经福建鸿兴福食品有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010999917.2/2.html,转载请声明来源钻瓜专利网。