[发明专利]个性化的声音处理系统和设备无效
申请号: | 201110058997.2 | 申请日: | 2011-03-12 |
公开(公告)号: | CN102682761A | 公开(公告)日: | 2012-09-19 |
发明(设计)人: | 谢津 | 申请(专利权)人: | 谢津 |
主分类号: | G10L11/00 | 分类号: | G10L11/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 230601 安徽省合肥市蜀山区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 个性化 声音 处理 系统 设备 | ||
技术领域
本发明涉及信号处理、心理声学和听觉生理学,更具体的说,本发明涉及一种个性化的声音处理系统,用于测试用户听力特征,报告用户的听力健康状况,并基于该用户的听力特征,将普通的音乐文件,加工成更加好听的、有利于该用户听力健康的、适于长期聆听的音乐文件。
背景技术
一些本发明中使用的词汇,其涵义分别列出如下。
人耳解剖结构——包括外耳、中耳、内耳、听神经、脑干和听神经中枢等。声音在外耳得到增强,中耳将空气振动转换成机械震动,内耳将机械震动转换成神经脉冲,神经脉冲经过听通路,最终到达听神经中枢,使人感觉到声音。
声学测试——本发明所述的声学测试包括两种:心理声学测试和听觉生理学测试。心理声学是研究声音和听觉之间关系的学科,而心理声学测试是测试一个人的听觉特征的实验。在物理学中,一个声音可以从频率、幅度和相位来描述;而心理声学的描述则不同,它从人类心理的角度把一个声音的属性描述为音高、响度和音色。
听觉生理学测试——发出声音给人听,然后记录下在听到声音之后这个人的物理特征的变化,如脑电和脑磁场的变化,这称为听觉生理学测试。常见的听觉生理学测试,包括听觉脑干响应(Auditory Brainstem Response,ABR),畸变产物耳声发射(Distortion Product Oto-Acoustic Emissions,DPOAE),复合动作电位(Compound Action Potential,CAP)和脑电图(Electroencephalography,EEG)。
声压强——是一种声音强度的度量单位,通常缩写为SPL (Sound Pressure Level),也称为声压级、声音强度或强度。它的单位是 dBSPL(Decibel Sound Pressure Level)。它是一个客观的描述音量大小的物理量。0 dBSPL是人类大约能听到的最小声音,痛苦的门限值为135 dBSPL。安静的背景音乐,通常在50 dBSPL,交响乐通常达到110 dBSPL或者更高,而很响的摇滚乐可以达到120 dBSPL。
纯音——只含有一个单一频率的声音。例如,1000Hz的正弦声波发出的声音,是一个1000赫兹的纯音。
谐波——由一个纯音,以及它的整数倍的频率,叠加共同组成的复合声音。
基音——谐波中最小的那个频率称为基音,也称为基频。
泛音——谐波中,除了基音,所有其它更高的整数倍的频率成分都称为泛音。
残余音——对于纯音, 它的音高主要决定于频率;而对于由基音和泛音组成的复合音,其音高较为复杂。自亥姆霍兹以来,普遍认为复合声的音高决定于基音的频率,因为基音的振幅在频谱中占优势。但是测试表明,若复合声的基频很弱,甚至完全被滤掉,它的音高仍维持基频的音高不变。这种失去基频仍保持音高不变的复合音,被称为残余音[1]。
单轨录音——用单一轨道,将所有现场的声音一起录下来的技术。
多轨录音——在音乐的制作过程中,使用许多轨将乐器和人声分别录进电脑;在后期处理中,经过合成后混为一个成品。多轨录音的作用和优势明显,它避免了“单轨录音”的两个缺点:缺点一,如果一个演奏者出了偏差,全部演奏者都要重来;缺点二,所有的乐器都录在一起,后期制作的时候,无法针对每件乐器做精细的调整。
耳蜗群延迟效应——当声音传播到了人耳的耳蜗,对不同的频率,耳蜗会产生不同的延迟时间。也就是说,进过耳蜗之后,高频的声音到达听觉神经较快,而低频的声音到达的较慢。这种效应,称为耳蜗群延迟效应。可以看出,耳蜗群延迟扭曲了声音的相位。对于耳蜗对相位的扭曲,研究者已经确定了其特性[2,3]。德波尔(De Boer)推导出了一种调频脉冲信号,该信号能够恰好补偿人类耳蜗带来的相位扭曲[2]。
临界频带——当两个声音的频率靠的很近时,人耳不能够区分出来。这个最小的频率差值,就称为临界频带。临界频带的宽度,一般认为1/3-1/6音程。人耳会倾向于合并在临界频带内的声音。不仅如此,不同的频带给人的感觉差异巨大, 16~60赫兹频段能给音乐以力度;提升60~250赫兹能够使音乐丰满;250~2000赫兹能赋予音色号角般的色彩;2000~4000赫兹人耳的灵敏度最好;4000~6000赫兹为清晰、明亮和主观感受的频段;5000赫兹稍加衰减定会使声音产生距离感和透明感;6000~20000赫兹则控制着声音的明亮与清晰,若稍加调整即可产生轻松、清脆和光泽感。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谢津,未经谢津许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110058997.2/2.html,转载请声明来源钻瓜专利网。