[发明专利]一种带有声音和面部双重识别的门禁装置有效
申请号: | 202210363845.1 | 申请日: | 2022-04-08 |
公开(公告)号: | CN114445954B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 官红英 | 申请(专利权)人: | 深圳市润璟元信息科技有限公司 |
主分类号: | G07C9/37 | 分类号: | G07C9/37;G10L15/22;G06V40/16;G06V10/75;G06K9/62 |
代理公司: | 北京中索知识产权代理有限公司 11640 | 代理人: | 邹长斌 |
地址: | 518102 广东省深圳市宝安区西*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 带有 声音 面部 双重 识别 门禁 装置 | ||
1.一种带有声音和面部双重识别的门禁装置,包括壳体(1),所述壳体(1)一侧设置有电源接口(8)和开关按键(14),其特征在于:所述壳体(1)上侧设置有补光灯(2)、光线传感器(3)、摄像头(4)、人体感应器(5)、防护凸条(6)、显示屏(7)和收音孔(13),其中所述显示屏(7)设置于壳体(1)上侧中部,所述显示屏(7)下侧设置有收音孔(13),所述显示屏两侧设置有防护凸条(6),所述显示屏(7)上侧中部设置有摄像头(4),所述摄像头(4)左侧依次设置有人体感应器(5)和补光灯(2),所述摄像头(4)右侧依次设置光线传感器(3)和补光灯(2),所述壳体(1)内部设置电池(9)、无线模块(10)、主控板(11)和语音输入器(12),其中所述语音输入器(12)设置于壳体内部下端,所述电池(9)设置在所述语音输入器(12)上方,并且所述电池(9)上方左侧设置主控板(11),所述电池(9)上方右侧设置有无线模块(10),其中所述电池(9)与电源接口(8)连接;其中所述主控板(11)设置有主控模块,所述主控模块分别与光线传感器(3)、开关按键、显示屏、摄像头(4)、补光灯(2)、人体感应器(5)、电源接口(8)、电池(9)、无线模块(10)和语音输入器(12)控制连接;
所述补光灯(2)为LED补光灯;所述防护凸条(6)突出壳体(1)之外4mm-7mm之间;所述主控模块包括基于S3C2440系列嵌入式S3C2440 ARM9型号芯片;
所述语音输入器(12)为能够实现计算机算法模型的TMS320VC5402语音处理模块,其中所述语音输入器(12)还设置有音频采集接口、语音流输入模块、语音信息过滤模块、语音信息提取模块、计算机算法模型、语音存储模块和语音输出模块,其中所述音频采集接口的输出接口与所述语音流输入模块的输入端连接,所述语音流输入模块的输出端与所述语音信息过滤模块的输入端连接,所述语音信息过滤模块的输出端与所述语音信息提取模块的输入端连接,所述TMS320VC5402语音处理模块分别与语音信息提取模块、计算机算法模型、语音存储模块和语音输出模块连接;
所述语音输入器(12)中的计算机算法模型为YOLO-V4算法模型;
所述语音输入器(12)实现语音的方法包括以下步骤:
步骤1、通过音频采集接口向语音流输入模块输入语音数据信息;
在本步骤中,通过设置多个音频采集接口实现语音输入器(12)对声音信号的多数据通道采集,以提高数据采集能力;
步骤2、通过语音信息过滤模块对语音数据信息杂波进行过滤;
在本步骤中,通过语音信息过滤模块实现输入语音数据信息特征的初始化处理,实现语音信息的整个音频数据信息检测,主要包括静音检测、过渡段检测、语音段检测和语音结束检测;并且能够通过消除噪声和信道失真实现语音信息增强,将语音信号从时域转化到频域;
步骤3、对输入的语音数据信息进行信息特征提取,识别输入的语音数据信息;
在本步骤中,对语音数据信息提取时,通过对语音信号进行采样、反混叠滤波、语音增强和语音截取的方式实现特征信息提取,从语音信号波形中提取一组或几组描述语音信号特征的语音数据信息参数;
识别输入的语音数据信息包括语音信息匹配模块法实现不同语音信息的识别,语音信息匹配模块通过训练语料学习词与词之间的相互关系,来估计假设词序列的语言模型分数,即存在这种语音数据信息的参数,在构建的构建参考模式库内,实现语音特征参数和语音信息匹配,当时采集到的语音识别模块与数据库内的数据信息匹配时,在实现语音数据信息识别,当采集到的语音识别模块不与数据库内的数据信息匹配时,则未实现语音数据信息识别;
步骤4、通过计算机算法模型对输入的语音数据信息进行评估;所述计算机算法模型为YOLO-V4算法模型,具体方法为:
建出YOLO-V4算法模型,通过人工智能方法实现不同声音信息的评估与分析;YOLO-V4算法模型架构的形式为CSPDarknet53+PAnet-SPP+Yolov3 head,在实现多语音数据信息尺度预测时,采用3个不同的尺度特征模块进行预测,时频数据信息大小为原分辨率得1/32,剩余2个尺度分别为1/16,1/8,预测方法为检测框、目标评价、类别预测三种信息编码,检测框设置6个参数,目标评价设置2个参数,类别数位设置100,声音预测输出张量维度分别设置为y1=13*13*255,y2=26*26*255,y3=52*52*255;
步骤5、将识别后的语音数据信息通过语音存储模块实现存储;
步骤6、通过语音输出模块实现数据信息的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市润璟元信息科技有限公司,未经深圳市润璟元信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210363845.1/1.html,转载请声明来源钻瓜专利网。