[发明专利]一种基于长短时记忆网络扫视路径学习的人群识别方法有效

专利信息
申请号: 201910566847.9 申请日: 2019-06-27
公开(公告)号: CN110298303B 公开(公告)日: 2022-03-25
发明(设计)人: 夏辰;韩军伟;郭雷;李宽;李红霞 申请(专利权)人: 西北工业大学
主分类号: G06V40/19 分类号: G06V40/19;G06V20/52;G06V10/26;G06N3/04
代理公司: 西北工业大学专利中心 61204 代理人: 刘新琼
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于长短时记忆网络扫视路径学习的人群识别方法,采集不同人群组别的眼动数据构建训练样本集,利用LSTM网络来有监督地学习出不同类别扫视模式与人群组别标记之间的映射关系,根据训练后的网络来对待评估观察者的扫视序列进行得分判定,实现基于扫视路径学习的人群识别,与其他手段结合帮助提高人群识别的准确性,促进相关应用的发展。
搜索关键词: 一种 基于 短时记忆 网络 扫视 路径 学习 人群 识别 方法
【主权项】:
1.一种基于长短时记忆网络扫视路径学习的人群识别方法,其特征在于步骤如下:步骤1:构建测试图像库首先根据具体人群识别问题来选择图像构建测试图像库;步骤2:采集不同人群组别扫视序列组织眼动实验分别采集不同组别观察者在测试图像库上的眼动数据,获取其中扫视路径序列;步骤3:提取扫视序列特征提取观察者在测试图像上扫视序列对应的特征,为下一步训练LSTM网络做准备;3a)图像过分割采用简单线性迭代聚类算法SLIC将图像分成多个过分割区域,其中每个过分割区域由相邻且具有相似特性的像素点组成;3b)提取扫视序列特征利用语义哈希算法来对采集的扫视路径进行特征提取:对于当前扫视路径上的每一个注视点,找到其所在图像过分割区域,提取该过分割区域中心大小为d×d×3的原始图像块,将其对应的向量输入到语义哈希编码特征提取网络中,提取中心层Nc维二值特征;即对于长度为m的扫视路径序列,得到其所对应的Nc×m扫视路径特征;步骤4:训练LSTM网络首先构建训练LSTM网络需要用到的训练样本集:训练样本集由扫视路径特征与对应的人群组别标记组成,LSTM网络的学习目标是建立由扫视路径特征到人群组别标记之间的映射关系;其次是利用训练样本集训练LSTM网络:依次将一个扫视路径上连续注视点对应的语义哈希编码特征作为网络输入,迭代得到最顶层回归层的人群组别预测得分,再使用基于时间的反向传播算法根据预测得分与对应标记的预测误差迭代调整网络参数,得到基于扫视路径的人群识别模型;步骤5:测试待评估观察者扫视序列利用眼动仪记录当前待评估观察者在测试图像上的扫视路径;采用同训练过程同样的方式提取各个扫视路径特征,即对于每一个扫视路径,找到其上每一个注视点所在的过分割区域,并提取该过分割中心对应的语义哈希编码,得到编码后的扫视序列,将该序列输入到训练后的人群识别模型中,得到该序列对应的回归层得分;步骤6:判断待评估观察者人群组别根据训练集上观察者的平均得分来依次计算两个相邻组别之间的平均得分划分阈值;对于每两个相邻组别,首先利用训练后LSTM网络预测该两个组别下各个观察者在所有测试图像上的平均得分,再利用最大类间方差法来对这两个相邻组别观察者的平均得分进行阈值划分;以此类推,对于n个组别的人群识别问题,得到n‑1个相邻组别划分阈值;最后计算待评估观察者扫视路径序列的平均得分,并判断该平均得分所在组别区间,完成人群识别判断。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910566847.9/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top