[发明专利]一种声音定向传输方法、系统、电子设备及存储介质在审
申请号: | 202110205186.4 | 申请日: | 2021-02-24 |
公开(公告)号: | CN113012677A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 樊天放 | 申请(专利权)人: | 辽宁省视讯技术研究有限公司 |
主分类号: | G10K11/26 | 分类号: | G10K11/26;G10L13/04;G06K9/00 |
代理公司: | 北京八月瓜知识产权代理有限公司 11543 | 代理人: | 李斌 |
地址: | 110000 辽宁省沈*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声音 定向 传输 方法 系统 电子设备 存储 介质 | ||
本发明公开了一种声音定向传输方法、系统、电子设备及存储介质,所述声音定向传输方法通过调用摄像头获取预定范围内声音接收端的图像;预先进行校准,确定人脸识别的范围,对所述图像进行人脸识别以实时确定接收端的位置坐标;调整声音传输端向所述位置坐标进行声音播放;本发明可以智能判断接收端位置,并能根据接收端运动方向控制播放的音源方向;可在多音源环境中,对特定群组,分组进行音源定向播放。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种声音定向传输方法、系统、电子设备及存储介质。
背景技术
声波(20Hz-20kHz)的定向传播可通过指向性换能器或换能器阵列实现,换能器辐射面的最大尺度与发射的声波波长决定了所发射的声束的指向性开角的大小,即换能器尺寸越大,声波频率越高,则指向性越好,实现定向声传播的效果也越好,而在可听声范围内实现声音的定向传输需要的扬声器尺寸很大,波束开角很宽甚至呈半球形,且在波束开角范围外仍然存在旁瓣带来的声波泄露问题,无法满足现今对高指向性扬声器的需求。因此,利用高频声波的高指向性和非线性声学的自解调原理来实现可听声定向传播,此时高频扬声器发射高指向性超声波,声波在空气中传播时的非线性效应可使声场中产生差频、和频、倍频声波。由于高频声波的高吸收特性,最终传播一段距离后只剩下频率较低的差频声波,该差频即是待发射的高指向性可听声。
定向声技术的发展逐渐成熟,在传媒广告领域中的应用也越来越多,尤其像博览馆展览馆企业展厅等文化科博项目、大型展会,商场超市,汽车等场合中得到广泛应用。但目前实现定向声播放的条件还存在着一定局限性,在声音播放过程中只能够对固定的区域进行定向播放,而不能智能的判断周围环境,根据环境中特定对象的移动而达到完全的定点定向音源播放效果。
发明内容
本发明的目的在于提供一种声音定向传输方法、系统、电子设备及存储介质,通过结合人脸识别的人工智能判断技术,定位需要播放音源的人群,从而实现声音定向传输的方法。
第一方面,本发明实施例提供了一种声音定向传输方法,所述声音定向传输方法包括以下步骤:
调用摄像头获取预定范围内声音接收端的图像;
预先进行校准,确定人脸识别的范围,对所述图像进行人脸识别以实时确定接收端的位置坐标;
调整声音传输端向所述位置坐标进行声音播放,其中,所述声音是经过预处理的。
可选地,所述声音传输端为多个,其中每个声音传输端均配置图像获取装置,根据距离声音传输端最近的位置坐标,进行声音传输端的方向调整。
可选地,声音预处理包括;
通过相位控制阵列方法将音频进行合成;
以波源为圆心,取相同的半径画半圆,得到各波的波前;
根据接收端的位置坐标,确定的一个主波,将主波向所述位置坐标方向输送。
第二方面,本发明实施例提供了一种声音定向传输系统,其特征在于,所述声音定向传输系统包括:
图像获取子系统,用于调用摄像头获取预定范围内声音接收端的图像;
位置坐标确定子系统,用于对所述图像进行人脸识别以实时确定接收端的位置坐标;
调整子系统,用于调整声音传输端向所述位置坐标进行声音播放,其中,所述声音是经过预处理的。
可选地,所述调整子系统包括,声音预处理模块,所述声音预处理模块具体包括:
音频合成单元,通过相位控制阵列方法将音频进行合成;
波前获取单元,用于以波源为圆心,取相同的半径画半圆,得到各波的波前;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁省视讯技术研究有限公司,未经辽宁省视讯技术研究有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110205186.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种连接孔的钨填充工艺方法
- 下一篇:设备测试方法、装置及计算机可读介质