[发明专利]一种基于单节点光子储备池计算的动作视频识别方法有效
申请号: | 202110597541.7 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113343813B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 李璞;胡春强;蔡强;开超;李佳一 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V20/40;G06V10/50;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 太原晋科知识产权代理事务所(特殊普通合伙) 14110 | 代理人: | 王军 |
地址: | 030024 *** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 节点 光子 储备 计算 动作 视频 识别 方法 | ||
1.一种基于单节点光子储备池计算的动作视频识别方法,其特征在于,包括:
基于KTH数据库获取标记好的人体动作视频并进行帧提取,并将标记好的人体动作帧图像划分为训练集和测试集;
构建基于单节点光子储备池计算的视频动作识别网络模型,视频动作识别网络模型包括输入层、储备池层和输出层;通过所述输入层对输入的人体动作帧图像进行预处理,储备池层为带有光放大器、高非线性光纤和自延迟反馈环的多纵模激光器,通过调节光放大器和高非线性光纤使得展宽的光谱覆盖多纵模激光器的所有纵模,对经过预处理的人体动作帧图像进行高维非线性映射;输出层用于输出识别结果;
将作为训练集的人体动作帧图像输入视频动作识别网络模型进行参数调整,至输出的结果为准确识别结果为止,训练完成后将作为测试集的人体动作帧图像输入视频动作识别网络模型,验证视频动作识别网络模型的识别准确性;
将实时获取的人体动作视频帧提取后得到的人体动作帧图像输入训练好的视频动作识别网络模型,输出结果即为识别结果。
2.根据权利要求1所述的基于单节点光子储备池计算的动作视频识别方法,其特征在于,输入层对标记好的人体动作帧图像进行预处理的步骤包括:
对KTH数据库的人体动作视频抽取帧,将各帧从原始的160×120像素裁剪为以人体质心为中心的80×120像素的人体动作帧图像;
对标记好的人体动作帧图像进行方向梯度直方图特征提取,将80×120像素的灰度图像转换为540×1的一维特征描述子;
特征描述子经历一个采样保持过程,经过采样保持后的序列和一个指定序列长度的掩模信号相乘;其中,所述掩模信号是N×540维,其元素为随机产生,N为虚拟节点数量;
将得到的N×1维向量输入至光子储备池层中。
3.根据权利要求2所述的基于单节点光子储备池计算的动作视频识别方法,其特征在于,混沌掩模信号的元素采集于经过差分处理的白混沌信号。
4.根据权利要求1所述的基于单节点光子储备池计算的动作视频识别方法,其特征在于,储备池层的结构包括:驱动激光器、马赫曾德尔调制器、光放大器、高非线性光纤、第一光纤耦合器、可调节光衰减器、光环形器、多纵模激光器和第二光纤耦合器;
其中,输入层输出的数据信号输入至马赫增德尔调制器的数据信号输入端,马赫增德尔调制器的激光信号输入端连接驱动激光器,以接收激光信号,马赫增德尔调制器的输出端连接至光放大器的输入端,光放大器的输出端连接至高非线性光纤的一端,高非线性光纤的另一端连接至第一光纤耦合器的第一端口a,第一光纤耦合器的第二端口b连接至可调节光衰减器的一端,可调节光衰减器的另一端连接至第二光纤耦合器的第一端口g,第二光纤耦合器的第二端口h连接至输出层,第二光纤耦合器的第三端口i连接至光环形器的第二端口e,第一光纤耦合器的第一端口c连接至光环形器的第一端口d,光环形器的第三端口f连接多纵模激光器;由第一光纤耦合器、第二光纤耦合器、可调节光衰减器及光环形器形成自延时反馈环。
5.根据权利要求1所述的基于单节点光子储备池计算的动作视频识别方法,其特征在于,在将实时获取的人体动作视频帧提取后得到的人体动作帧图像输入训练好的视频动作识别网络模型进行结果识别的步骤中,采用赢者通吃的决策策略,将输出向量与对应人体动作进行类别匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110597541.7/1.html,转载请声明来源钻瓜专利网。