[发明专利]会议发言人定位方法、装置、会议设备及存储介质在审
申请号: | 202210210122.8 | 申请日: | 2022-03-04 |
公开(公告)号: | CN114581830A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 廖科华;肖伟华;徐琛 | 申请(专利权)人: | 深圳市康冠商用科技有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V40/16 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 李燕娥 |
地址: | 518000 广东省深圳市龙岗区坂田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 会议 发言人 定位 方法 装置 会议设备 存储 介质 | ||
本发明实施例公开了一种会议发言人定位方法、装置、会议设备及存储介质,涉及视频会议技术领域。其中该方法通过获取声源信息并根据声源信息确定其对应的发言人所在的预设角度区间及角度;判断发言人所在的角度是否超出预设发言人区间;若发言人所在的角度在预设发言人区间内,则基于发言人所在的角度根据预设的会议信息暂存表预测发言人当前的位置坐标;若发言人所在的角度超出预设发言人区间,则根据发言人所在的角度裁取预设区间的图片信息,通过人脸检测算法对图片信息进行检测以输出发言人当前的位置坐标。通过预设的会议信息暂存表来预测并输出发言人当前的位置坐标以减轻通过人脸检测算法所消耗的算力,以缓解会议平板的算力压力。
技术领域
本发明涉及视频会议技术领域,尤其涉及一种会议发言人定位方法、装置、会议设备及存储介质。
背景技术
会议场景一般会用到大型会议平板,会议平板上装有阵列麦克风和摄像头,在会议开始时当开启影随声动功能后,阵列麦克风会采集声音数据进行人声角度的输出、摄像头会采集视频数据进行人脸识别和唇动检测,在经过上述算法的检测以及对算法结果进行处理后,会议平板识别并输出发言人当前的位置坐标,以供会议平板后续处理的使用。
现有大型会议平板在识别并输出发言人当前的位置坐标上存在许多不足之处,比较突出的是有的检测算法的种类不够完善,有的缺少音频算法、有的缺少唇动检测等,其主要原因是由于外挂的小型处理器的算力不够而导致一些算法的缺失或者算法的配置变低。所以目前市面上以存在的带音视频算法的发言人定位技术,都普遍比较消耗算力,一些性能较差的处理板处理音视频算法会存在算力的压力。
发明内容
本发明实施例提供了一种会议发言人定位方法、装置、会议设备及存储介质,旨在解决现有会议平板在识别并输出发言人当前的位置坐标时消耗太多算力,存在算力压力的问题。
第一方面,本发明实施例提供了一种会议发言人定位方法,该方法通过获取声源信息并根据所述声源信息确定所述声源信息对应的发言人所在的预设角度区间及角度;判断所述发言人所在的角度是否超出预设发言人区间;若所述发言人所在的角度在所述预设发言人区间内,则基于所述发言人所在的角度根据所述预设的会议信息暂存表预测并输出所述发言人当前的位置坐标,将所述发言人当前的位置坐标更新至所述预设的会议信息暂存表,其中,所述预设会议信息暂存表是基于所述预设角度区间建立的,所述预设会议信息暂存表中存储有与预设角度区间对应的发言人的历史位置坐标;若所述发言人所在的角度超出所述预设发言人区间,则根据所述发言人所在的角度裁取预设区间的图片信息,通过人脸检测算法对所述图片信息进行检测以获取并输出所述发言人当前的位置坐标,将所述发言人当前的位置坐标更新至所述预设的会议信息暂存表。
第二方面,本发明实施例还提供了一种会议发言人定位装置,该装置包括:获取确定单元,用于获取声源信息并根据所述声源信息确定所述声源信息对应的发言人所在的预设角度区间及角度;第一判断单元,用于判断所述发言人所在的角度是否超出预设发言人区间;预测输出单元,用于若所述发言人所在的角度在所述预设发言人区间内,则基于所述发言人所在的角度根据所述预设的会议信息暂存表预测并输出所述发言人当前的位置坐标,将所述发言人当前的位置坐标更新至所述预设的会议信息暂存表,其中,所述预设会议信息暂存表是基于所述预设角度区间建立的,所述预设会议信息暂存表中存储有与预设角度区间对应的发言人的历史位置坐标;第一检测单元,用于若所述发言人所在的角度超出所述预设发言人区间,则根据所述发言人所在的角度裁取预设区间的图片信息,通过人脸检测算法对所述图片信息进行检测以获取并输出所述发言人当前的位置坐标,将所述发言人当前的位置坐标更新至所述预设的会议信息暂存表。
第三方面,本发明实施例还提供了一种会议设备,所述会议设备设有阵列麦克风和摄像头,所述会议设备还包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行上述计算机程序时实现上述方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时实现上述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市康冠商用科技有限公司,未经深圳市康冠商用科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210210122.8/2.html,转载请声明来源钻瓜专利网。