[发明专利]一种录音文件的命名分类方法及系统有效
申请号: | 201510228698.7 | 申请日: | 2015-05-07 |
公开(公告)号: | CN104867494B | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 曾元清 | 申请(专利权)人: | 广东欧珀移动通信有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;H04M1/65;G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 张大威 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 录音 文件 命名 分类 方法 系统 | ||
1.一种录音文件的命名分类方法,应用于具有音色识别功能的录音终端中,所述方法包括:
S1、在录音终端中预先建立人物音色ID数据库,并建立网络数据库,所述人物音色ID数据库保存有人物音色数据,且各人物音色数据对应着相应的身份标识信息,所述网络数据库用于保存非人类声音范围内的音色数据及其对应的身份标识信息;
S2、当完成录音后,对录音文件中的语音数据进行人声识别,提取录音文件中属于人类声音范围内的人声语音数据;当对录音文件中的语音数据进行人声识别后,若无法识别出人声语音数据,则提取录音文件中的音色数据,将其与所述网络数据库中的非人声音色数据进行匹配对比,若匹配成功,则根据匹配结果对录音文件进行分类并命名;
S3、对所述的人声语音数据进行音色识别,识别出所述人声语音数据中每一说话者的音色数据;
S4、依次提取所述人声语音数据中每一说话者的音色数据,将其与所述人物音色ID数据库中的人物音色数据进行匹配对比;若匹配成功,则提取相应的人物音色数据对应的身份标识信息;若匹配不成功,则播放一段与该音色数据相应的人声语音数据,并弹出相应的操作窗口以供用户对该音色数据进行标注相应的身份标识信息;
S5、对所述提取的身份标识信息和/或标注的身份标识信息进行整合处理,并将整合处理后的身份标识信息中的全部或部分信息作为所述录音文件的文件名,其中,当从所述人声语音数据中提取出一位说话者的音色数据时,将所述一位说话者的音色数据对应的身份标识信息作为所述录音文件的文件名;当从所述人声语音数据中提取出二位说话者的音色数据时,对所述二位说话者的音色数据对应的身份标识信息进行整合处理,将整合后的身份标识信息作为所述录音文件的文件名;当从所述人声语音数据中提取出至少三位说话者的音色数据时,获取所述至少三位说话者的音色数据对应的身份标识信息,并选取出 现频率最高的三个说话者的身份标识信息进行整合处理,将整合处理后的身份标识信息作为所述录音文件的文件名;
S6、根据文件名中的全部或部分身份标识信息对命名后的录音文件进行自动分类,或提供一操作选项供用户根据文件名中的全部或部分身份标识信息对命名后的录音文件进行分类。
2.根据权利要求1所述的录音文件的命名分类方法,其特征在于,提取录音文件中的音色数据,将其与所述网络数据库中的非人声音色数据进行匹配对比,包括:
提取录音文件中语音数据中出现频率最高的音色数据,将其与用于保存非人类声音范围内的音色数据的网络数据库中的非人声音色数据进行匹配对比;
在提取录音文件中的音色数据,将其与所述网络数据库中的非人声音色数据进行匹配对比之后,所述步骤S2还包括:
若匹配失败,则提取录音文件的语音数据中的音量信息及音调信息进行识别判断,当判断音量和/或音调超过预设的阈值时,则将该录音文件定义为垃圾录音文件,并以预设的特殊符号作为该录音文件的文件名。
3.根据权利要求1所述的录音文件的命名分类方法,其特征在于,所述步骤S4还包括,当用户将未能与人物音色ID数据库中的人物音色数据匹配成功的音色数据进行标注相应的身份标识信息后,将该音色数据及其对应的身份标识信息保存于所述人物音色ID数据库中。
4.根据权利要求1~3中任一项所述的录音文件的命名分类方法,其特征在于:所述录音终端为具有录音功能的手机。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东欧珀移动通信有限公司,未经广东欧珀移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510228698.7/1.html,转载请声明来源钻瓜专利网。