[发明专利]使用多模匹配方案的对象辨识有效
申请号: | 201380019248.6 | 申请日: | 2013-03-07 |
公开(公告)号: | CN104246796B | 公开(公告)日: | 2018-04-17 |
发明(设计)人: | 埃里克·维瑟;王海音;哈西卜·A·西迪基;金莱轩 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06T7/207;G06T7/292;H04R3/00 |
代理公司: | 北京律盟知识产权代理有限责任公司11287 | 代理人: | 宋献涛 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明揭示用于辨识和定位场景中的一或多个对象的方法、系统和制品。俘获所述场景的图像和/或视频。使用在所述场景处记录的音频,缩窄所述所俘获场景的对象搜索。举例来说,可确定声音的到达方向DOA且用以限制所俘获图像/视频中的搜索区域。在另一实例中,可基于在所述所记录音频中识别的声音的类型来选择关键点标志。关键点标志对应于系统经配置以辨识的特定对象。随后可使用移位不变特征变换SIFT分析,将所述所俘获场景中识别的关键点与所述选定关键点标志进行比较来辨识所述场景中的对象。 | ||
搜索关键词: | 使用 匹配 方案 对象 辨识 | ||
【主权项】:
一种由装置辨识场景中的对象的方法,所述方法包括:从在场景处记录的音频计算多个声学辨识特征;以及将所述声学辨识特征与对应于一或多个对象的预定声学辨识特征进行比较以确定对象的声音源类型;基于所述声音源类型选择所述对象中的稳定关键点;以及基于选定关键点和所述声音源类型识别所述对象。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201380019248.6/,转载请声明来源钻瓜专利网。
- 上一篇:分体式智能磨床
- 下一篇:分体壁挂吸顶两用型室内机