[发明专利]一种基于栈式自编码的活动识别方法在审
申请号: | 201510207815.1 | 申请日: | 2015-04-28 |
公开(公告)号: | CN104850735A | 公开(公告)日: | 2015-08-19 |
发明(设计)人: | 陈岭;沈延斌;郭浩东 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 编码 活动 识别 方法 | ||
技术领域
本发明涉及活动识别技术领域,具体涉及一种基于栈式自编码的活动识别方法。
背景技术
随着普适计算不断发展,越来越多的智能应用出现在各个领域并服务于大众,这些应用极大的方便了人们的生活,而想在普适环境中开发实用有效的应用,其中的核心问题便是识别人们的活动。活动识别主要由预处理信号、提取特征和识别活动这三部分组成,其中特征的表征能力强弱对于最终的活动识别准确率高低有重要影响。
活动识别中的数据一般来自各种传感器的信号,常用的传感器有加速度传感器和生理传感器等。对于这些传感器信号提取的特征主要是基于领域知识的时域和频域特征,如均值、方差、能量、相关系数和熵等,然而这些特征的表征能力有限。对于加速度传感器而言,用这些特征进行活动识别需要将传感器固定在特定的位置,当加速度传感器放置在其他位置时活动识别准确率会明显下降,但是这一情况在普适环境中经常发生。目前解决该问题的方法包括:假设加速度传感器位置改变时加速度信号特征分布会偏移,通过EM算法在线无监督估计该偏移;使用降维的方法对加速度信号进行处理,然后再提取模式特征模体解决放置位置不同的问题等。然而这些方法一方面算法复杂,另一方面设计特征比较困难。
对于生理传感器而言,一般提取心率、呼吸率、呼吸振幅、皮肤温度和皮肤电阻等生理信号的时域特征和频域特征。同时在此基础上设计生理信号独有的特征,如心率变异特征,心率、呼吸率、呼吸振幅、皮肤温度、人体姿态、心电振幅这些生理信号的结构特征和瞬时特征。然而使用传统特征进行活动识别的准确率不理想,设计新的生理特征需要相关的领域知识比较困难。
发明内容
针对现有技术的不足,本发明提供了一种基于栈式自编码的活动识别方法。
一种基于栈式自编码的活动识别方法,包括如下步骤:
步骤1:获取用户在设定时间内的活动数据,所述活动数据为由若干数据点形成的时序数据,每个数据点包括信号值和对应的采集时间;
步骤2:对所述的时序数据进行预处理得到若干时序数据帧;
步骤3:采用栈式自编码神经网络法根据预处理后得到的时序数据帧求解全局模型,并利用所述的全局模型确定各个时序数据帧对应的深度特征向量,并将所有时序数据帧对应的深度特征向量组合为深度特征矩阵;
步骤4:基于若干个正确标记活动的深度特征矩阵进行训练识别模型,并利用训练得到的识别模型进行活动识别。
本发明中用户在日常活动时的数据点可以为生理数据或活动数据,多通过传感器采集得到,且采集时可根据需求设定采集频率。通常生理数据可以为心率、呼吸率、呼吸振幅、皮肤温度和皮肤电阻等。
本发明中步骤1中设定时间根据识别需求设定。
本发明中步骤4中训练识别模型时采用的正确标记的深度特征矩阵的各个可以根据实际情况设定,考虑到得到的识别模型的精度和训练所需的时间,本发明中基于1000~2000个正确标记活动的深度特征矩阵进行训练识别模型。
本发明中利用识别模型进行活动识别时,需要通过步骤1~步骤3获取待进行活动识别的用户的深度特征矩阵,然后以该深度特征矩阵作为得到识模型的输入,输出即为识别结果(活动类型,可采用数值表示)。
所述步骤1中预处理过程如下:
2-1:根据各个数据点的采集时间对获取的时序数据进行数据成帧,得到若干时序数据帧;
2-2:针对数据成帧得到的每一个时序数据帧,根据任意相邻两个数据点对应的采集时间确定该相邻两个数据点之间是否有缺失数据点:
若没有缺失数据点,则不处理;
否则,根据相邻两个数据点的信号值采用均值法对缺失数据点进行补全。
本发明中进行数据成帧按照时间间隔划分。得到的各个时序数据帧中,任意相邻两个时序数据帧的数据成帧之间在时间上可以存在重合也可以不存在重合,只需保证后一帧的开始时刻和结束时刻都分别晚于前一帧的开始时刻和结束时刻即可。
为了尽可能多的涵盖传感器数据的全部特征信息,作为优选,任意相邻两个时序数据帧之间在时间上存在重叠,进一步优选,在时间上存在50%的重叠。
本发明中预处理得到的时序数据帧的个数取决于任意相邻两个时序数据帧的时间重叠率以及划分时序数据帧时采用的时间间隔。
由于用户在日常活动时的时序数据多采用传感器采集得到,而传感器采集数据时可能由于信号传输或外接环境等因此,造成数据丢失,因此产生缺失数据点。通过补全,能够保证得到的每一个时序数据帧中的长度相同,以便于进行后续处理,有利于提高活动识别的识别速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510207815.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用