[实用新型]一种多模态信息融合说话人定位装置有效

专利信息
申请号: 202021921416.4 申请日: 2020-09-04
公开(公告)号: CN213240485U 公开(公告)日: 2021-05-18
发明(设计)人: 金浩然;李诚宇 申请(专利权)人: 中国地质大学(武汉)
主分类号: G01S5/18 分类号: G01S5/18;G06K9/00;H04R1/40;H04N5/33
代理公司: 武汉知产时代知识产权代理有限公司 42238 代理人: 孔灿
地址: 430000 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多模态 信息 融合 说话 人定 装置
【说明书】:

本实用新型提供一种多模态信息融合说话人定位装置,包括底层保护盖、旋转平台、第一麦克风阵列、摄像头、传感装置、第二麦克风阵列和顶层保护盖,旋转平台固定在底层保护盖上方,第一麦克风阵列安装在底层保护盖上,摄像头和传感装置并排固定在旋转平台一侧,第二麦克风阵列固定在顶层保护盖的底面,顶层保护盖位于旋转平台正上方,顶层保护盖上表面设有显示屏。本实用新型的有益效果:本实用新型通过第一麦克风阵列、摄像头和第二麦克风阵列以实时定位说话人的方位,并通过热成像传感器和红外测距传感器的结合,有效对说话人的水平方向角、垂直俯仰角及距离进行准确定位,同时还可有效解决传统设备无法区分真实用户和非真实用户的问题。

技术领域

本实用新型涉及声音与图像信息融合技术领域,尤其涉及一种多模态信息融合说话人定位装置。

背景技术

近年来,随着人工智能领域的飞速发展,人们对人机交互模式展开了进一步的探索。有研究指出,键盘打字的平均速度为每分钟41个字,而人每分钟平均可以说出150个字。在输入效率上,语音的信息交换密度远远领先于键盘输入。由于语言交流具有天然的优势,语音交互一经应用便迅速推广到各种应用场景中。根据中国信通院数据显示,我国智能语音市场规模已超百亿元。随着互联网、移动智能终端的快速发展,人们对人机交互技术提出了更高的要求。以人为中心、自然、高效是发展新一代人机交互方式的主要目标。

为保证快速准确的获得用户在复杂环境下的语音交互信息,也为了对用户的需求有更加准确的响应,机器需要准确的获得说话人的位置,从而进行后续的定向语音识别、情感识别以及为用户提供定向服务等操作。

现有说话人定位方案多采用声音或图像单模态定位,这些定位方法在噪声较大或是环境光较复杂的条件下难以完成精确定位。部分发明者提出将图像与声音信息融合提高定位精度,但在实施过程中出现了距离信息精度不高的问题,这导致了具体位置无法准确确定的问题。此外,声音图像融合的方法存在将照片和电子屏显示的人像识别为真实用户的缺点,这对定位装置的识别精度造成了负面影响。现有装置还存在依赖上位机的缺点,装置自身只能完成信号的采集和简单预处理,无法独立完成整个定位过程。

实用新型内容

有鉴于此,本实用新型的实施例提供了一种多模态信息融合说话人定位装置。

本实用新型的实施例提供一种多模态信息融合说话人定位装置,包括底层保护盖、旋转平台、第一麦克风阵列、摄像头、传感装置、第二麦克风阵列和顶层保护盖,所述旋转平台的截面为圆形,且其通过旋转轴固定在所述底层保护盖上方,所述第一麦克风阵列安装在所述底层保护盖上,所述摄像头和所述传感装置并排固定在所述旋转平台一侧,且所述摄像头和所述传感装置前方设有保护罩,所述保护罩后方设有圆弧型保护壳,所述第二麦克风阵列固定在所述顶层保护盖的底面,所述顶层保护盖与所述底层保护盖相对设置,且其位于所述旋转平台正上方并固定在所述保护壳上,所述顶层保护盖上表面设有显示屏。

进一步地,包括内置处理器,所述内置处理器安装在所述旋转平台上,且所述第一麦克风阵列、所述摄像头、所述传感装置和所述第二麦克风阵列分别与所述内置处理器连接。

进一步地,所述第一麦克风阵列和所述第二麦克风阵列均包括至少三个等间隔等角度设置的麦克风,且所述第一麦克风阵列的各所述麦克风和所述第二麦克风阵列的各所述麦克风一一相对设置。

进一步地,所述第一麦克风阵列和所述第二麦克风阵列前方均设有金属网状的麦克风防尘罩,两所述麦克风防尘罩均为圆弧型,且两所述麦克风防尘罩均与所述保护壳连接。

进一步地,所述传感装置包括热成像传感器和红外测距传感器,所述摄像头与所述热成像传感器和所述红外测距传感器并排设置,且所述摄像头位于所述热成像传感器与所述红外测距传感器之间。

进一步地,所述保护壳一侧设有用于供电和/或数据传输的接口。

进一步地,所述旋转轴的上端固定在所述旋转平台的中部,其下端与电机的动力输出轴连接。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202021921416.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top