[发明专利]一种音频文件的情绪活跃度获取方法及分类方法、装置有效
申请号: | 201410521416.8 | 申请日: | 2014-09-30 |
公开(公告)号: | CN104318931B | 公开(公告)日: | 2017-11-21 |
发明(设计)人: | 王徽蓉 | 申请(专利权)人: | 北京音之邦文化科技有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63 |
代理公司: | 北京金律言科知识产权代理事务所(普通合伙)11461 | 代理人: | 逯博,罗延红 |
地址: | 100027 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频文件 情绪 活跃 获取 方法 分类 装置 | ||
技术领域
本发明涉及语音处理技术领域,尤其涉及一种音频文件的情绪活跃度获取方法及分类方法、装置。
背景技术
现有技术中,在对音频文件进行情绪分析时,对音频文件进行分析,提取出音频文件的音频特征,通过采用模式识别的方式对音频文件进行分类。
在模式识别的方式,首先提取音频文件的特征,例如,提取音频文件的强度特征、音色特征、以及频谱相关的特征,在提取特征之后,使用分类器模型进行有监督的学习,训练模型建立起来以后,从而实现对未知音频文件的预测。通过模式识别的方式,虽然能够进行几种情况的分类,但模式识别并不能将音频文件所表达的情绪进行量化。
发明内容
本发明实施例提供一种音频文件的情绪活跃度获取方法及分类方法、装置,通过对音频文件的情绪活跃度进行量化,为用户通过情绪活跃度选歌提供依据。
为达到上述目的,本发明的实施例采用如下技术方案:
一种音频文件的情绪活跃度获取方法,该包括:
获取所述音频文件的语谱图;
从所述语谱图中获取所述音频文件中的语音频率的峰点个数;
通过所述峰点个数与所述音频文件的时长确定所述音频文件的情绪活跃度。
一种音频文件的分类方法,该方法包括:
通过上述技术方案所述的方法获取所述音频文件的情绪活跃度;
根据所述情绪活跃度对歌曲库中的音乐文件进行分类。
一种音频文件的情绪活跃度获取装置,该包括:
语谱图获取模块,用于获取所述音频文件的语谱图;
峰点个数获取模块,用于从所述语谱图中获取所述音频文件中的语音频率的峰点个数;
情绪活跃度确定模块,用于通过所述峰点个数与所述音频文件的时长确定所述音频文件的情绪活跃度。
一种音频文件的分类装置,该装置包括:
上述技术方案所述的音频文件的情绪活跃度获取装置通过上述技术方案所述的情绪活跃度获取方法获取所述音频文件的情绪活跃度;
分类模块,用于根据所述情绪活跃度对歌曲库中的音乐文件进行分类。
本发明实施例提供的一种音频文件的情绪活跃度获取方法及分类方法、装置,通过从语谱图中获取音频文件中的语音频率的峰点个数,并通过峰点个数与音频文件的时长确定音频文件的情绪活跃度,实现了对音频文件的情绪活跃度进行量化,为用户通过情绪活跃度选歌提供依据。
附图说明
图1为本发明实施例提供的一个语谱图的示意图;
图2为本发明实施例一提供的音频文件的情绪活跃度获取方法的流程示意图;
图3为本发明实施例二提供的音频文件的情绪活跃度获取方法的流程示意图;
图4为图3所示实施例在步骤320-330的滤波前的语谱图在时间与频率坐标轴中的示意图;
图5为图3所示实施例经过步骤320-330的滤波后的语谱图在时间与频率坐标轴中的示意图;
图6为本发明实施例三提供的音频文件的情绪活跃度获取方法的流程示意图;
图7为本发明实施例四提供的音频文件的情绪活跃度获取装置的结构示意图;
图8为本发明实施例五提供的音频文件的情绪活跃度获取装置的结构示意图;
图9为本发明实施例六提供的音频文件的情绪活跃度获取装置的结构示意图。
具体实施方式
下面结合附图对本发明实施例提供的音频文件的情绪活跃度获取方法及分类方法、装置进行详细描述。
图1为本发明实施例提供的一个语谱图的示意图,如图1所示,语谱图的X轴表示时间(对应图1中斜向下方向的轴),Y轴表示频率(对应图1中水平向右方向的轴),Z轴表示语音数据能量,语音信号在时域进行变换得到频域的频谱图,该频谱图即为语谱图。
在图1中,可以看到与周围相比颜色深的点,该颜色深的点表示语音信号中的当前点相对于周边的点幅度最高的点,该点可以成为本发明实施例中所述的峰点,由此可见,本发明实施例中所述的峰点并不仅由相应的幅度值来确定,而是相对于周围的点而言的幅度值比较大的点。
下面将详细说明本发明的实施例。
实施例一:
图2为本发明实施例一提供的音频文件的情绪活跃度获取方法的流程示意图,如图2所示,本发明实施例包括以下步骤:
步骤210,获取音频文件的语谱图。
步骤220,从语谱图中获取音频文件中的语音频率的峰点个数。
步骤230,通过峰点个数与音频文件的时长确定音频文件的情绪活跃度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京音之邦文化科技有限公司,未经北京音之邦文化科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410521416.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防盗型移动硬盘
- 下一篇:子带处理单元以及生成合成子带信号的方法