[发明专利]用于移动装置的智能音频记录的系统和方法有效
申请号: | 201180025888.9 | 申请日: | 2011-04-08 |
公开(公告)号: | CN102907077A | 公开(公告)日: | 2013-01-30 |
发明(设计)人: | 太元·李;哈立德·埃尔-马勒;柳熙钟;辛钟元 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | H04M1/725 | 分类号: | H04M1/725 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 宋献涛 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 移动 装置 智能 音频 记录 系统 方法 | ||
相关申请案
本发明主张2010年4月8日申请的题目为“智能音频记录(SMART AUDIO LOGGING)”的第61/322,176号美国临时申请案的优先权,所述临时申请案转让给本受让人且特此明确地以引用的方式并入本文中。
技术领域
本发明大体上涉及音频和语音信号俘获。更具体地说,本发明涉及能够基于音频上下文信息的分析来起始且/或终止音频和语音信号俘获操作或(可互换地说)记录操作的移动装置。
背景技术
由于专用集成电路(ASIC)的功率控制技术进步以及例如数字信号处理器(DSP)等移动处理器或微处理器的计算能力增加,越来越多的移动装置现在能够实现复杂得多的特征,所述特征归因于缺少所需要的计算能力或硬件(HW)支持而直到现在才被视为切实可行的。举例来说,最初开发移动台(MS)或移动电话以使得能够经由传统的基于电路的无线蜂窝式网络进行话音或语音通信。因此,原先设计MS以解决基本的话音应用,如话音压缩、声学回声消除(AEC)、噪声抑制(NS)和话音录入。
实施话音压缩算法的过程被称为声码,且实施设备被称为声码器或“语音译码器”。存在若干种标准化声码算法以支持需要语音通信的不同数字通信系统。第三代合作伙伴计划2(3GPP2)是实例标准化组织,其指定码分多址(CDMA)技术,例如IS-95、CDMA20001x无线电发射技术(1xRTT)和CDMA2000演进数据优化(EV-DO)通信系统。第三代合作伙伴计划(3GPP)是另一实例标准化组织,其指定全球移动通信系统(GSM)、通用移动电信系统(UMTS)、高速下行链路包接入(HSDPA)、高速上行链路包接入(HSUPA)、高速包接入演进(HSPA+)和长期演进(LTE)。因特网协议话音(VOIP)是在3GPP和3GPP2中所定义的通信系统以及其它系统中使用的实例协议。此类通信系统和协议中所采用的声码器的实例包括国际电信联盟(ITU)-T G.729、自适应性多速率(AMR)编解码器和增强型可变速率编解码器(EVRC)语音服务选项3、68和70。
话音录入是用以录入人类话音的应用。话音录入常常被可互换地称为话音记录或话音存储。话音录入允许用户将由一个或一个以上麦克风拾取的语音信号的某部分保存到存储器空间中。所保存的话音录入可稍后在同一装置中播放,或其可通过话音通信系统发射到不同装置。虽然话音录入器可录入一些音乐信号,但所录入的音乐的质量通常并不是极好的,因为话音录入器是针对人类声道所发出的语音特性来优化的。
音频录入或音频记录有时可与话音录入互换地使用,但其有时被理解成用以录入包括人类话音、乐器和音乐在内的任何可听声音的不同应用,因为其能够俘获频率比人类声道所产生的信号高的信号。在本申请案的上下文中,“音频记录”或“音频录入”术语将广泛地用以指代话音录入或音频录入。
音频记录使得能够录入通常由一个或一个以上移动装置中的一个或一个以上麦克风拾取的所关注的音频信号的全部或一些部分。音频记录有时被可互换地称为音频录入或音频备忘录。
发明内容
本文献描述一种针对移动装置处理数字音频信号的方法。所述方法包括:通过至少一个麦克风接收声学信号;将所述所接收的声学信号转换为所述数字音频信号;从所述数字音频信号提取至少一个听觉上下文信息;响应于自动检测到开始事件指示符,针对所述数字音频信号执行音频记录;以及响应于自动检测到结束事件指示符,结束所述音频记录。此至少一个听觉上下文信息可与音频分类、关键词识别或说话者识别相关。此至少一个听觉上下文信息可至少部分基于信号能量、信噪比、频谱倾斜或过零率。此至少一个听觉上下文信息可至少部分基于非听觉信息,例如日程安排信息或日历信息。本文献还描述与此方法相关的设备、装置组合和计算机可读媒体。
本文献还描述一种针对移动装置处理数字音频信号的方法。所述方法包括:通过至少一个麦克风接收声学信号;将所述所接收的声学信号变换为电信号;基于用于每一经取样数据的取样频率和数据宽度来取样所述电信号以获得所述数字音频信号;将所述数字音频信号存储到缓冲器中;从所述数字音频信号提取至少一个听觉上下文信息;响应于自动检测到开始事件指示符,针对所述数字音频信号执行音频记录;以及响应于自动检测到结束事件指示符,结束所述音频记录。此检测所述开始或结束事件指示符可至少部分基于非听觉信息,例如日程安排信息或日历信息。本文献还描述与此方法相关的设备、装置组合和计算机可读媒体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180025888.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可高效集油的量油分离器
- 下一篇:一种油相水相分离装置