[发明专利]一种录音文件的命名分类方法及系统有效

申请号：	201510228698.7	申请日：	2015-05-07
公开（公告）号：	CN104867494B	公开（公告）日：	2017-10-24
发明（设计）人：	曾元清	申请（专利权）人：	广东欧珀移动通信有限公司
主分类号：	G10L15/08	分类号：	G10L15/08;H04M1/65;G06F17/30
代理公司：	北京清亦华知识产权代理事务所(普通合伙)11201	代理人：	张大威
地址：	523860 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种录音文件的命名分类方法及系统，其通过音色数据识别，能对录音文件中的各人物的音色数据进行识别，在对录音文件进行命名时可根据各人物的音色数据对应的身份标识信息来进行命名；此外，若录音文件中没有人物参与录音，其还可根据录音文件中出现频率最高的音色数据去进行分类命名，或者根据该录音文件中的语音数据的音量信息及音调信息是否超过预设的阈值来将该录音文件定义为垃圾录音文件。利用本发明，用户在查找录音文件时可根据文件名快速地找到所需的录音文件，其有效地解决了现有技术中在查找录音文件时存在的费时麻烦，用户体验差等问题。
搜索关键词：	一种录音文件命名分类方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种录音文件的命名分类方法，应用于具有音色识别功能的录音终端中，所述方法包括：S1、在录音终端中预先建立人物音色ID数据库，并建立网络数据库，所述人物音色ID数据库保存有人物音色数据，且各人物音色数据对应着相应的身份标识信息，所述网络数据库用于保存非人类声音范围内的音色数据及其对应的身份标识信息；S2、当完成录音后，对录音文件中的语音数据进行人声识别，提取录音文件中属于人类声音范围内的人声语音数据；当对录音文件中的语音数据进行人声识别后，若无法识别出人声语音数据，则提取录音文件中的音色数据，将其与所述网络数据库中的非人声音色数据进行匹配对比，若匹配成功，则根据匹配结果对录音文件进行分类并命名；S3、对所述的人声语音数据进行音色识别，识别出所述人声语音数据中每一说话者的音色数据；S4、依次提取所述人声语音数据中每一说话者的音色数据，将其与所述人物音色ID数据库中的人物音色数据进行匹配对比；若匹配成功，则提取相应的人物音色数据对应的身份标识信息；若匹配不成功，则播放一段与该音色数据相应的人声语音数据，并弹出相应的操作窗口以供用户对该音色数据进行标注相应的身份标识信息；S5、对所述提取的身份标识信息和/或标注的身份标识信息进行整合处理，并将整合处理后的身份标识信息中的全部或部分信息作为所述录音文件的文件名，其中，当从所述人声语音数据中提取出一位说话者的音色数据时，将所述一位说话者的音色数据对应的身份标识信息作为所述录音文件的文件名；当从所述人声语音数据中提取出二位说话者的音色数据时，对所述二位说话者的音色数据对应的身份标识信息进行整合处理，将整合后的身份标识信息作为所述录音文件的文件名；当从所述人声语音数据中提取出至少三位说话者的音色数据时，获取所述至少三位说话者的音色数据对应的身份标识信息，并选取出现频率最高的三个说话者的身份标识信息进行整合处理，将整合处理后的身份标识信息作为所述录音文件的文件名；S6、根据文件名中的全部或部分身份标识信息对命名后的录音文件进行自动分类，或提供一操作选项供用户根据文件名中的全部或部分身份标识信息对命名后的录音文件进行分类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广东欧珀移动通信有限公司，未经广东欧珀移动通信有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510228698.7/，转载请声明来源钻瓜专利网。

上一篇：一种移动通讯终端及其语音增强方法和模块
下一篇：拼接显示装置屏幕亮度的调节装置和方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种录音文件的命名分类方法及系统有效

专利文献下载