[发明专利]个性化的声音处理系统和设备无效

专利信息
申请号: 201110058997.2 申请日: 2011-03-12
公开(公告)号: CN102682761A 公开(公告)日: 2012-09-19
发明(设计)人: 谢津 申请(专利权)人: 谢津
主分类号: G10L11/00 分类号: G10L11/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 230601 安徽省合肥市蜀山区*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 个性化 声音 处理 系统 设备
【说明书】:

技术领域

发明涉及信号处理、心理声学和听觉生理学,更具体的说,本发明涉及一种个性化的声音处理系统,用于测试用户听力特征,报告用户的听力健康状况,并基于该用户的听力特征,将普通的音乐文件,加工成更加好听的、有利于该用户听力健康的、适于长期聆听的音乐文件。 

背景技术

一些本发明中使用的词汇,其涵义分别列出如下。 

人耳解剖结构——包括外耳、中耳、内耳、听神经、脑干和听神经中枢等。声音在外耳得到增强,中耳将空气振动转换成机械震动,内耳将机械震动转换成神经脉冲,神经脉冲经过听通路,最终到达听神经中枢,使人感觉到声音。 

声学测试——本发明所述的声学测试包括两种:心理声学测试和听觉生理学测试。心理声学是研究声音和听觉之间关系的学科,而心理声学测试是测试一个人的听觉特征的实验。在物理学中,一个声音可以从频率、幅度和相位来描述;而心理声学的描述则不同,它从人类心理的角度把一个声音的属性描述为音高、响度和音色。 

听觉生理学测试——发出声音给人听,然后记录下在听到声音之后这个人的物理特征的变化,如脑电和脑磁场的变化,这称为听觉生理学测试。常见的听觉生理学测试,包括听觉脑干响应(Auditory Brainstem Response,ABR),畸变产物耳声发射(Distortion Product Oto-Acoustic Emissions,DPOAE),复合动作电位(Compound Action Potential,CAP)和脑电图(Electroencephalography,EEG)。 

声压强——是一种声音强度的度量单位,通常缩写为SPL (Sound Pressure Level),也称为声压级、声音强度或强度。它的单位是 dBSPL(Decibel Sound Pressure Level)。它是一个客观的描述音量大小的物理量。0 dBSPL是人类大约能听到的最小声音,痛苦的门限值为135 dBSPL。安静的背景音乐,通常在50 dBSPL,交响乐通常达到110 dBSPL或者更高,而很响的摇滚乐可以达到120 dBSPL。 

纯音——只含有一个单一频率的声音。例如,1000Hz的正弦声波发出的声音,是一个1000赫兹的纯音。 

谐波——由一个纯音,以及它的整数倍的频率,叠加共同组成的复合声音。 

基音——谐波中最小的那个频率称为基音,也称为基频。 

泛音——谐波中,除了基音,所有其它更高的整数倍的频率成分都称为泛音。 

残余音——对于纯音, 它的音高主要决定于频率;而对于由基音和泛音组成的复合音,其音高较为复杂。自亥姆霍兹以来,普遍认为复合声的音高决定于基音的频率,因为基音的振幅在频谱中占优势。但是测试表明,若复合声的基频很弱,甚至完全被滤掉,它的音高仍维持基频的音高不变。这种失去基频仍保持音高不变的复合音,被称为残余音[1]。 

单轨录音——用单一轨道,将所有现场的声音一起录下来的技术。 

多轨录音——在音乐的制作过程中,使用许多轨将乐器和人声分别录进电脑;在后期处理中,经过合成后混为一个成品。多轨录音的作用和优势明显,它避免了“单轨录音”的两个缺点:缺点一,如果一个演奏者出了偏差,全部演奏者都要重来;缺点二,所有的乐器都录在一起,后期制作的时候,无法针对每件乐器做精细的调整。 

耳蜗群延迟效应——当声音传播到了人耳的耳蜗,对不同的频率,耳蜗会产生不同的延迟时间。也就是说,进过耳蜗之后,高频的声音到达听觉神经较快,而低频的声音到达的较慢。这种效应,称为耳蜗群延迟效应。可以看出,耳蜗群延迟扭曲了声音的相位。对于耳蜗对相位的扭曲,研究者已经确定了其特性[2,3]。德波尔(De Boer)推导出了一种调频脉冲信号,该信号能够恰好补偿人类耳蜗带来的相位扭曲[2]。 

临界频带——当两个声音的频率靠的很近时,人耳不能够区分出来。这个最小的频率差值,就称为临界频带。临界频带的宽度,一般认为1/3-1/6音程。人耳会倾向于合并在临界频带内的声音。不仅如此,不同的频带给人的感觉差异巨大, 16~60赫兹频段能给音乐以力度;提升60~250赫兹能够使音乐丰满;250~2000赫兹能赋予音色号角般的色彩;2000~4000赫兹人耳的灵敏度最好;4000~6000赫兹为清晰、明亮和主观感受的频段;5000赫兹稍加衰减定会使声音产生距离感和透明感;6000~20000赫兹则控制着声音的明亮与清晰,若稍加调整即可产生轻松、清脆和光泽感。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谢津,未经谢津许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110058997.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top