[发明专利]语音信息的批量筛选方法、装置、计算机设备及存储介质在审
申请号: | 201910197526.6 | 申请日: | 2019-03-15 |
公开(公告)号: | CN110059059A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 王涛 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/14 | 分类号: | G06F16/14;G06F16/172;G06F16/61;G06F16/683;G10L15/06;G10L15/16;G10L15/26 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 邓星文 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件夹地址 语音信息 预设 特征信息 输出 筛选 信息处理指令 计算机设备 文件夹 存储介质 读取 语音信息存储 依次读取 语音筛选 训练集 脚本 调用 匹配 统一 | ||
1.一种语音信息的批量筛选方法,其特征在于,所述方法包括:
若接收到信息处理指令,获取预设的训练集所在的文件夹的地址,并将该地址作为输入文件夹地址,所述训练集包括多个待处理语音信息;
根据所述信息处理指令确定预设阀值以及预设的第一输出文件夹地址、第二输出文件夹地址,其中,所述第一输出文件夹地址为第一输出文件夹被保存的地址,所述第一输出文件夹包括多个可读文本文件,所述第二输出文件夹地址为第二输出文件夹被保存的地址;
读取所述输入文件夹地址以获取所有的待处理语音信息;
调用预设的语音筛选脚本以分别提取每个待处理语音信息的特征信息,并将每个待处理语音信息的特征信息分别写入不同的可读文本文件中;
依次读取所述第一输出文件夹中的所有的可读文本文件中的特征信息以判断所述可读文本文件中的特征信息是否与预设阀值相匹配;
若所述可读文本文件中的特征信息与预设阀值相匹配,则将该可读文本文件所对应的待测语音信息存储至所述第二输出文件夹中以用于批量输出。
2.如权利要求1所述的方法,其特征在于,所述根据所述信息处理指令确定预设阀值以及预设的第一输出文件夹地址、第二输出文件夹地址的步骤,包括:
解析所述信息处理指令以得到相应的预设信息;
根据所述预设信息确定预设阀值以及预设的第一输出文件夹地址、第二输出文件夹地址。
3.如权利要求1所述的方法,其特征在于,所述预设阀值包括预设时长阀值,所述特征信息包括音频时长,所述依次读取所述第一输出文件夹中的所有的可读文本文件中的特征信息以判断所述可读文本文件中的特征信息是否与预设阀值相匹配的步骤,包括:
依次读取所述第一输出文件夹中的所有的可读文本文件中的音频时长;
判断所述可读文本文件中的音频时长是否大于或等于预设时长阀值;
若所述可读文本文件中的音频时长大于或等于预设时长阀值,则判定所述可读文本文件中的特征信息与预设阀值相匹配。
4.如权利要求3所述的方法,其特征在于,所述判定所述可读文本文件中的特征信息与预设阀值相匹配的步骤之前,包括:
若所述可读文本文件中的音频时长大于或等于预设时长阀值,依次读取所述第一输出文件夹中的所有的可读文本文件中的采样点数;
判断所述可读文本文件中的采样点数大于或等于预设采样点数;
若所述可读文本文件中的采样点数大于或等于预设采样点数,则判定所述可读文本文件中的特征信息与预设阀值相匹配。
5.如权利要求1所述的方法,其特征在于,所述调用预设的语音筛选脚本以分别提取每个待处理语音信息的特征信息,并将每个待处理语音信息的特征信息分别写入不同的可读文本文件中的步骤之前,包括:
依次读取所述第一输出文件夹中的所有的可读文本文件中的特征信息以分别确定每个待处理语音信息的音频格式;
若所述待处理语音信息的音频格式为预设音频格式,保持所述待处理语音信息的音频格式不变;
若所述待处理语音信息的音频格式不为预设音频格式,根据预设的音频格式转换规则将所述待处理语音信息的音频格式转换为预设音频格式。
6.如权利要求5所述的方法,其特征在于,所述信息处理指令包括预设的第三输出文件夹地址,所述方法还包括:
依次读取所述第一输出文件夹中的所有的可读文本文件中的特征信息以分别判断每个可读文本文件中的特征信息的类型是否与预设的特征信息的类型相匹配;
若所述可读文本文件中的特征信息的类型与预设的特征信息的类型不相匹配,判定所述可读文本文件所对应的待测语音信息为无效语音信息,并将该待测语音信息信息存储至所述第三输出文件夹地址所对应的第三输出文件夹中。
7.如权利要求1所述的方法,其特征在于,所述信息处理指令包括第四输出文件夹地址,所述方法还包括:
若所述可读文本文件中的特征信息与预设阀值不相匹配,则将该可读文本文件所对应的待测语音信息存储至所述第四输出文件夹地址所对应的第四输出文件夹中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910197526.6/1.html,转载请声明来源钻瓜专利网。