[发明专利]一种无接触门铃来访处理方法及相关设备有效
申请号: | 202210282760.0 | 申请日: | 2022-03-22 |
公开(公告)号: | CN114596535B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 靳涵宇 | 申请(专利权)人: | 天目爱视(北京)科技有限公司 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V20/40;G06V40/20;G06V10/82;G06N3/0464;G06N3/084;G06F17/13;G06F17/16;H04M1/72427;H04M1/72439;H04N7/14 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100102 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 接触 门铃 来访 处理 方法 相关 设备 | ||
1.一种无接触门铃来访处理方法,其特征在于,包括:
S1,获取监测区域图像数据,
S2,根据基于神经网络模型的分析方法分析图像数据,检测是否有来访者进入监测区域;
若检测到有来访者进入监测区域,则提示来访者做出指定行为,进入S3;否则返回S1;
S3,若检测到来访者做出指定行为,则将来访信号发送至独立终端;否则返回S2;
在所述提示来访者做出指定行为之后,进入来访者响应检测环节,包含两组并列步骤:
步骤P1、将摄像机采集到的图像同步传送给独立终端上,供终端用户查看;
步骤P2、启动来访者响应智能检测方法:
采集一段时间T′内的图像数据,取T′=3秒;
假设上述时间T′内共采集了F帧图像,按采集先后顺序记一帧图像为If,f表示采集顺序的下标,f∈{1,2,...,F};记If(u,v)表示图像If中坐标为(u,v)的一个像素,对应于步骤1中所述的图像分辨率640*480,u∈{1,2,...,480},v∈{1,2,...,640};
前述F帧图像以像素为单位,构成一个640*480*F维的三维矩阵,记该矩阵为:
V(u,v,f),1≤u≤480,1≤v≤640,1≤f≤F,u,v,f为整数
进一步的,定义V的偏导数如下:
上述三式中,分别表示矩阵V在三个方向上的偏导数,Δu、Δv、Δf为三个方向上的离散单位增量,为1;h表示像素取值范围,为256;同样是三维矩阵;
定义:
分别为矩阵的均值,NV=640×480×F表示三维矩阵中的元素个数;
定义:
三式中,分别为矩阵的标准差,NV的含义同上;
如果:
ρ为经验参数,
则判定有人来访,则向独立终端发送来访信号;
神经网络模型包括:定义神经网络模型的第一层隐藏层:
式中,表示输入层中以(u',v',t')为中心的卷积窗口的权重,p,q,r表示卷积窗口中相对位置的整数坐标,其中,p,q为卷积窗口的空间维度,r为卷积窗口的时间维度,的窗口大小为9*9*5,对应p、q的取值范围为-4到4,r的取值范围为-2到2,X(u′+p,v′+q,t′+r)表示输入层在坐标(u′+p,v′+q,t′+r)处的节点,即高斯差分图像Bt′+r在坐标(u′+p,v′+q)处的像素取值;表示第一层隐藏层中坐标为(x,y,z)的节点,这个节点根据式子(4)的窗口参数定义,与输入层的9*9*5个节点相连接,b0为线性偏置量,σ(x)为一非线性函数:
ex表示指数函数,使神经网络能够对非线性数据样本实现分类,α是经验参数,通过调整该经验参数,有助于改善模型的分类效果;
定义神经网络的第二层隐藏层:
式中,表示第一层隐藏层中以(x,y,z)为中心的卷积窗口的权重,p,q,r表示卷积窗口中相对位置的整数坐标,其中,p,q为卷积窗口的空间维度,r为卷积窗口的时间维度,窗口大小为7*7*5,对应p、q的取值范围为-3到3,r的取值范围为-2到2,表示第一层隐藏层中在坐标(x+p,y+q,z+r)处的节点,表示第二层隐藏层中坐标为(x,y,z)的节点,根据式子(6)的窗口参数定义,这个节点与第一层隐藏层中的7*7*5个节点相连,b1为线性偏置量,σ(x)为如式(5)定义的非线性函数;
定义神经网络的第三层隐藏层:
式中,max表示对应于空间的两个维度内,与第三层隐藏层的节点对应的第二层隐藏层一定范围的节点的最大值,这个范围由p、q定义,且p、q取值范围为0、1、2、3,因此这个范围为4*4,表示第二层隐藏层中坐标为(4x+p,4y+q,z)的节点,表示第三层隐藏层坐标为(x,y,z)的节点,并与第二层隐藏层的4*4=16个节点相连,b2为线性偏置量,σ(x)由式子(5)定义;
定义神经网络的第四层隐藏层为:
式中,max表示对应于时间的维度,与第四层隐藏层的节点对应的第三层隐藏层一定范围的节点的最大值,这个范围由r定义,r的范围为-1、0,1,因此时间窗口范围为3,表示第三层隐藏层中坐标为(x,y,3z+r)的节点,表示第四层隐藏层中坐标为(x,y,z)的节点,根据(8)定义与第三层隐藏层的3个节点相连,b3为线性偏置量,σ(x)由式子(5)定义;
定义神经网络的第五层隐藏层:
式中,表示第四层隐藏层中以(x,y,z)为中心的卷积窗口的权重,p,q,r表示卷积窗口中相对位置的整数坐标,其中,p,q为卷积窗口的空间维度,r为卷积窗口的时间维度,窗口大小为5*5*3,对应p、q的取值范围为-2到2,r的取值范围为-1到1,表示第四层隐藏层中在坐标(x+p,y+q,z+r)处的节点,表示第五层隐藏层中坐标为(x,y,z)的节点,根据式子(9)的窗口参数定义,这个节点与第一层隐藏层中的5*5*3个节点相连,b4为线性偏置量,σ(x)为如式(5)定义的非线性函数;
定义输出层:
式中,为第五层隐藏层中的一个节点,p,q,r,定义了节点的位置,表示隐藏层第五层节点与输出层唯一节点Ω之间的连接权重,b5为线性偏置量,σ(x)由式子(5)定义;
神经网络的输出层节点Ω,取值范围为[0,1],表示对应于输入的高斯差分图像的该时间段内是否有人进入的概率,当y趋向于0时,表示没有人进入该区域活动,当y趋向于1时,表示有人进入该区域活动;
式(4)-(10)中神经网络每一层的权重参数和偏置参数b0、b1、b2、b3、b4、b5需要通过训练样本学习获得,预先准备若干组训练样本,每组训练样本包括T+1帧连续采集图像计算获得的T帧高斯差分图像,及与之对应的是否出现人员活动的标记值1或0,如果训练样本中有人活动,则标记值为1,否则标记值为0,每组训练样本及其标记值作为神经网络模型的一组训练输入,并采取下列方法对神经网络模型进行学习;
根据神经网络模型(4)-(10)的定义计算给定训练样本输入值时的输出结果,并与训练样本的标记值相对比,获得一个对比值,该对比值定义为一个代价函数:
其中,表示输出的真实值,Ω表示根据神经网络模型(4)-(10)对输入图像序列进行计算后对输出的估计值;参数λ、θ为控制参数,有助于提高模型的噪声的鲁棒性;
采用后向传播方法求取代价函数(11)的极值,实现对神经网络模型的训练,确定神经网络模型中式子(4)-(10)的各项连接权重与线性偏置量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天目爱视(北京)科技有限公司,未经天目爱视(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210282760.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于处理含镍废水的方法和装置
- 下一篇:一种用于城市防洪的应急防洪墙