[发明专利]基于音频数据获取事件指示的方法和设备在审
申请号: | 201880039515.9 | 申请日: | 2018-06-13 |
公开(公告)号: | CN110800053A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | F·阿尔伯格;N·麦提森;P·帕派欧阿努 | 申请(专利权)人: | 米纳特有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G08B29/18;G10L25/18;G10L25/27 |
代理公司: | 11410 北京市中伦律师事务所 | 代理人: | 杨黎峰 |
地址: | 瑞典*** | 国省代码: | 瑞典;SE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理节点 通信设备 事件指示 音频数据 存储 关联 计算机程序 | ||
一种由处理节点(10)执行的方法,包括以下步骤:i,从至少一个通信设备(100)获取(11)与声音相关联的音频数据(12),并将音频数据(12)存储(13)在处理节点(10)中;ii,获取(15)与声音相关联的事件指示(16),并将事件指示(16)存储(17)在处理节点(10)中;iii,确定(19)将音频数据(12)与事件指示(16)相关联的模型(20),并存储(21)模型;以及iv,向通信设备(100)提供(23)模型(20)。还描述了由通信设备(100)执行的方法以及用于执行这些方法的处理节点(10)、通信设备(100)、系统(1000)和计算机程序。
技术领域
本发明涉及用于基于音频数据获取事件指示(event designation)的方法和设备的领域,诸如用于基于与事件相关联的声音获取事件已经发生的指示。这种技术可以例如用于所谓的智能家庭设备。该方法和设备可以包括与处理节点相连地放置在家庭或其他环境中的一个或多个通信设备,该处理节点用于获取与在通信设备附近发生的事件有关的音频数据,该通信设备用于基于与通信设备在事件发生时记录的声音相关联的音频数据来获取事件指示,即,标识事件的信息。
背景技术
今天,已知各种类型的智能家庭设备。这些设备包括具有网络功能的摄像机,其能够从一个位置(诸如家庭内部或类似场所)记录视频和音频且/或通过网络服务(互联网)向用户流式传输视频和音频,以便在手持设备(诸如移动电话)上观看。
对于视频,可以使用图像分析来提供事件指示,并引导用户注意事件正在发生或已经发生的事实。其他传感器(诸如磁接触和振动传感器)也用于提供事件指示。
声音是事件的值得考虑的有吸引力的表现形式,因为与使用视频来检测事件相比,声音通常需要更小的带宽。因此,已知有这样的设备,其通过记录和存储声音来获取音频数据,并且使用预定算法来尝试将音频数据识别或分类为与特定事件相关联,并由此获取并输出指示该事件的信息。
这些设备包括所谓的婴儿监视器,其提供被放置在婴儿附近的第一“婴儿”单元设备和由婴儿父母携带的第二“父母”单元设备之间的通信,以便可以监视婴儿的活动,并且可以远程确定婴儿的状态(睡眠/清醒)。
这种类型的设备通常受益于提供事件指示的能力,即,当特定事件正在发生或已经发生时通知用户,因为这消除了对持续监视的需要。在婴儿监视器的情况下,这包括第一设备用于在由第一设备记录了与婴儿哭泣的声音一致的音频数据时提供诸如信息“婴儿哭泣”的特定事件指示的配置。该事件指示可以用于触发第一单元和第二单元中的一者或两者,使得第二单元接收并输出婴儿哭泣的声音,否则为静音。
因此,第一单元可以连续地记录音频数据,并将其与表示诸如哭泣的婴儿的特定事件的音频数据进行比较,并且如果记录的音频数据与代表性音频数据匹配,则警告用户。可能与事件和音频数据类似地关联的事件指示包括枪响、玻璃破碎、警报响、狗吠、门铃响、尖叫和咳嗽。
针对若能够被识别则会方便且有用的大量事件以及获取以供人员或系统采取进一步行动的大量事件指示,对于能够在更多样化的背景和环境中且在音频数据与同时发生的多个事件的声音相关联的情况下以更高的准确度针对更多事件提供与音频数据相关联的事件指示的方法和系统存在很高的需求。
尤其是,使用声音识别功能获取针对更多事件的更多事件指示的能力对于从此类技术中获取更多益处而言非常重要。这些更多事件和声音可以包括例如门的打开和关闭、指示建筑物或环境中存在人或动物的声音、交通、特定的狗、猫和其他宠物的声音等。然而,由于这些类型的事件与诸如枪击、尖叫和玻璃破碎的独特声音并没有关联,并且由于与这些事件相关的声音对于本技术的每个用户而言可能都是非常特定的,所以难以获取这些事件的代表性音频数据,并且因此难以获取针对这些事件的事件指示。
发明内容
因此,本发明的目的包括提供能够针对更多事件的更多声音提供事件指示的方法和设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于米纳特有限公司,未经米纳特有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880039515.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音隐私系统和/或相关联的方法
- 下一篇:命令地址输入缓冲器偏置电流减小