[发明专利]个性化的声音处理系统和设备无效

申请号：	201110058997.2	申请日：	2011-03-12
公开（公告）号：	CN102682761A	公开（公告）日：	2012-09-19
发明（设计）人：	谢津	申请（专利权）人：	谢津
主分类号：	G10L11/00	分类号：	G10L11/00
代理公司：	暂无信息	代理人：	暂无信息
地址：	230601 安徽省合肥市蜀山区***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	个性化声音处理系统设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及信号处理、心理声学和听觉生理学，更具体的说，本发明涉及一种个性化的声音处理系统，用于测试用户听力特征，报告用户的听力健康状况，并基于该用户的听力特征，将普通的音乐文件，加工成更加好听的、有利于该用户听力健康的、适于长期聆听的音乐文件。

背景技术

一些本发明中使用的词汇，其涵义分别列出如下。

人耳解剖结构——包括外耳、中耳、内耳、听神经、脑干和听神经中枢等。声音在外耳得到增强，中耳将空气振动转换成机械震动，内耳将机械震动转换成神经脉冲，神经脉冲经过听通路，最终到达听神经中枢，使人感觉到声音。

声学测试——本发明所述的声学测试包括两种：心理声学测试和听觉生理学测试。心理声学是研究声音和听觉之间关系的学科，而心理声学测试是测试一个人的听觉特征的实验。在物理学中，一个声音可以从频率、幅度和相位来描述；而心理声学的描述则不同，它从人类心理的角度把一个声音的属性描述为音高、响度和音色。

听觉生理学测试——发出声音给人听，然后记录下在听到声音之后这个人的物理特征的变化，如脑电和脑磁场的变化，这称为听觉生理学测试。常见的听觉生理学测试，包括听觉脑干响应（Auditory Brainstem Response，ABR），畸变产物耳声发射（Distortion Product Oto-Acoustic Emissions，DPOAE)，复合动作电位(Compound Action Potential，CAP)和脑电图（Electroencephalography，EEG）。

声压强——是一种声音强度的度量单位，通常缩写为SPL (Sound Pressure Level)，也称为声压级、声音强度或强度。它的单位是 dBSPL(Decibel Sound Pressure Level)。它是一个客观的描述音量大小的物理量。0 dBSPL是人类大约能听到的最小声音，痛苦的门限值为135 dBSPL。安静的背景音乐，通常在50 dBSPL，交响乐通常达到110 dBSPL或者更高，而很响的摇滚乐可以达到120 dBSPL。

纯音——只含有一个单一频率的声音。例如，1000Hz的正弦声波发出的声音，是一个1000赫兹的纯音。

谐波——由一个纯音，以及它的整数倍的频率，叠加共同组成的复合声音。

基音——谐波中最小的那个频率称为基音，也称为基频。

泛音——谐波中，除了基音，所有其它更高的整数倍的频率成分都称为泛音。

残余音——对于纯音, 它的音高主要决定于频率；而对于由基音和泛音组成的复合音，其音高较为复杂。自亥姆霍兹以来,普遍认为复合声的音高决定于基音的频率，因为基音的振幅在频谱中占优势。但是测试表明,若复合声的基频很弱,甚至完全被滤掉，它的音高仍维持基频的音高不变。这种失去基频仍保持音高不变的复合音，被称为残余音[1]。

单轨录音——用单一轨道，将所有现场的声音一起录下来的技术。

多轨录音——在音乐的制作过程中，使用许多轨将乐器和人声分别录进电脑；在后期处理中，经过合成后混为一个成品。多轨录音的作用和优势明显，它避免了“单轨录音”的两个缺点：缺点一，如果一个演奏者出了偏差，全部演奏者都要重来；缺点二，所有的乐器都录在一起，后期制作的时候，无法针对每件乐器做精细的调整。

耳蜗群延迟效应——当声音传播到了人耳的耳蜗，对不同的频率，耳蜗会产生不同的延迟时间。也就是说，进过耳蜗之后，高频的声音到达听觉神经较快，而低频的声音到达的较慢。这种效应，称为耳蜗群延迟效应。可以看出，耳蜗群延迟扭曲了声音的相位。对于耳蜗对相位的扭曲，研究者已经确定了其特性[2,3]。德波尔(De Boer)推导出了一种调频脉冲信号，该信号能够恰好补偿人类耳蜗带来的相位扭曲[2]。

临界频带——当两个声音的频率靠的很近时，人耳不能够区分出来。这个最小的频率差值，就称为临界频带。临界频带的宽度，一般认为1/3-1/6音程。人耳会倾向于合并在临界频带内的声音。不仅如此，不同的频带给人的感觉差异巨大， 16～60赫兹频段能给音乐以力度；提升60～250赫兹能够使音乐丰满；250～2000赫兹能赋予音色号角般的色彩；2000～4000赫兹人耳的灵敏度最好；4000～6000赫兹为清晰、明亮和主观感受的频段；5000赫兹稍加衰减定会使声音产生距离感和透明感；6000～20000赫兹则控制着声音的明亮与清晰，若稍加调整即可产生轻松、清脆和光泽感。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于谢津，未经谢津许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201110058997.2/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L11-00 不限定于G10L 15/00至G10L 21/00单独一组中的语音或音频特征的测定或检测
G10L11-02 .检测有无语音信号
G10L11-04 .语音信号的音调测定
G10L11-06 .语音信号的浊音和清音之间的鉴别

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]个性化的声音处理系统和设备无效

专利文献下载