[发明专利]一种心理健康状态评估方法在审
申请号: | 201210576344.8 | 申请日: | 2012-12-26 |
公开(公告)号: | CN103905486A | 公开(公告)日: | 2014-07-02 |
发明(设计)人: | 朱廷劭;张帆;李昂;李一琳 | 申请(专利权)人: | 中国科学院心理研究所 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;G16H50/30 |
代理公司: | 北京瑞恒信达知识产权代理事务所(普通合伙) 11382 | 代理人: | 苗青盛;黄庆芳 |
地址: | 100101*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 心理健康 状态 评估 方法 | ||
1.一种心理状态评估方法,包括下列步骤:
1)、利用机器学习的方法,基于已知样本中个体网络行为特征和人口统计学特征,建立和训练基于网络行为特征的心理状态评估模型;
2)、获取新个体的网络行为特征和人口统计学特征,根据所述的基于网络行为特征的心理状态评估模型,得到该新个体的心理状况;
其中:
所述方法不用于疾病的诊断;
所述网络行为特征是反映个体所使用的网络媒介/服务工具的功能结果和使用路径的特征集合;所述网络行为特征从记录个体的网络日志中提取;以及
所述网络行为特征包括个体的网络信息和时间序列数据,所述个体的网络信息包括:时间信息、各类即时通讯工具信息、邮件信息、所访问网页类别的信息和搜索信息;所述时间序列数据包括:每天的上网时间信息、每天的网络请求个数信息和每天的网页信息;所述时间信息包括:工作日平均每日上网时长和周末平均每日上网时长;所述邮件信息包括是否用客户端收发邮件。
2.根据权利要求1所述的心理状态评估方法,其特征在于,提取所述网络行为特征的过程包括下列步骤:
11)利用网络流监控设备,获取个体的网络日志;
12)对网络日志进行数据预处理;
13)从网络日志中提取出个体的网络访问记录,所述个体的网络访问记录是以个体为单位存储的结构化文档。
3.根据权利要求2所述的心理状态评估方法,其特征在于,所述步骤11)中,网络流监控设备以镜像、桥接或者网关方式驳接个体接入互联网的关口控制设备;网络流监控设备根据网络请求的协议类型将获取到的数据包分发到不同的数据表中。
4.根据权利要求3所述的心理状态评估方法,其特征在于,所述数据表包括:个体身份标识、网络请求的访问时间、客户端IP和端口、服务器IP和端口、传输协议和传输内容。
5.根据权利要求3所述的心理状态评估方法,其特征在于,所述步骤12)包括下列步骤:
121)、进行数据集成,将来源于针对同一个体的所有网络流监控设备的数据集合起来并统一存储;
122)、进行数据清洗,清除日志中的异常数据,纠正错误,去除冗余数据,标准化日志格式;
123)、进行数据变换,将日志转换成适用于数据挖掘的形式;
所述步骤122)中,对无标题页面做清洗;
所述步骤123)中,清洗后的数据以个体为单位进行聚集,并按时间排序,最后以个体为单位各自单独保存为网络访问记录;所述网络访问记录采用XML标准作为文档的存储格式。
6.根据权利要求1所述的心理状态评估方法,其特征在于,所述步骤1)、2)中,所述基于网络行为特征的心理状态评估模型采用的数学模型是回归模型、基于分类器的模型或者M5P回归模型。
7.根据权利要求1所述的心理状态评估方法,其特征在于,所述所访问网页类别的信息包括:访问数量排名前列的网页类别、经常访问的网页类别个数、用过的BBS站点个数、用过的社交网络个数和用过的微博个数。
8.根据权利要求1所述的心理状态评估方法,其特征在于,所述搜索信息包括:搜索过的类别个数、经常搜索的类别个数、用过的搜索引擎个数和常用的搜索引擎的个数;
所述每天的上网时间信息包括:总时长、白天的上网时长、晚上的上网时长、上网时间段个数、上线时刻、下线时刻、活跃时刻、是否半夜上网和是否深夜上网。
9.根据权利要求1所述的心理状态评估方法,其特征在于,所述每天的网络请求个数信息包括:总请求数、每个类型的请求数、即时通讯的聊天对象个数和处理的信息数、对网页分类后的各类网页请求个数、各类网页中的第一个网页;
所述每天的网页信息包括:所访问的网站个数、网页类别数、直接或由收藏夹访问的网页数、搜索内容的类别数、使用的搜索引擎数和搜索关键字平均长度;
所述网络行为特征还包括上网天数的统计数据,所述上网天数的统计数据包括:总天数、上网天数、不上网天数和深夜上网天数。
10.一种建立和训练基于网络行为特征的心理状态评估模型的方法,
利用机器学习的方法,基于已知样本中个体网络行为特征和人口统计学特征,建立和训练基于网络行为特征的心理状态评估模型;所述网络行为特征是反映个体所使用的网络媒介/服务工具的功能结果和使用路径的特征集合;其中,所述方法不用于疾病的诊断;所述网络行为特征包括个体的网络信息和时间序列数据,所述个体的网络信息包括:时间信息、各类即时通讯工具信息、邮件信息、所访问网页类别的信息和搜索信息;所述时间序列数据包括:每天的上网时间信息、每天的网络请求个数信息和每天的网页信息;所述时间信息包括:工作日平均每日上网时长和周末平均每日上网时长;
所述邮件信息包括是否用客户端收发邮件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院心理研究所,未经中国科学院心理研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210576344.8/1.html,转载请声明来源钻瓜专利网。