[发明专利]基于潜在语义索引的上网行为分析方法、系统和介质在审
申请号: | 202011571954.X | 申请日: | 2020-12-27 |
公开(公告)号: | CN112686050A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 张强;喻波;王志海;魏力;谢福进 | 申请(专利权)人: | 北京明朝万达科技股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06F16/955;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100142 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 潜在 语义 索引 上网 行为 分析 方法 系统 介质 | ||
1.一种基于潜在语义索引的上网行为分析方法,其特征在于,所述方法包括:
步骤S1、基于用户历史上网日志来确定所述用户的上网行为的潜在语义特征矩阵;
步骤S2、利用所述潜在语义特征矩阵来计算所述用户的上网行为的行为链;以及
步骤S3、根据所述行为链构建LSTM深度神经网络模型,以检测所述用户的异常上网行为。
2.根据权利要求1所述的基于潜在语义索引的上网行为分析方法,其特征在于,在所述步骤S1中:
获取所述用户的历史上网日志中的URL和所述URL对应的网页文本;
基于所述URL和所述URL对应的网页文本来确定网页语义特征矩阵,所述网页语义特征矩阵用于表征所述用户的上网行为特征;以及
对所述网页语义特征矩阵进行奇异值分解和降维处理,来重构所述网页语义特征矩阵,以获得基于潜在语义空间的所述潜在语义特征矩阵;
其中,对于所述网页语义特征矩阵,矩阵行为所述网页文本中的词语,矩阵列为所述URL,矩阵值为所述词语在所述URL中出现的频次。
3.根据权利要求1所述的基于潜在语义索引的上网行为分析方法,其特征在于,在所述步骤S2中,
利用所述潜在语义特征矩阵来计算所述用户的上网行为基线;以及
根据所述上网行为基线来确定所述用户的上网行为偏差,以构建所述用户的上网行为的行为链,其中所述行为链中的值为所述URL的行为偏差值。
4.根据权利要求2所述的基于潜在语义索引的上网行为分析方法,其特征在于,所述方法还包括,更新所述网页语义特征矩阵,将所述用户新访问的URL添加至所述网页语义特征矩阵。
5.一种基于潜在语义索引的上网行为分析系统,其特征在于,所述系统包括:
确定模块,被配置为,基于用户历史上网日志来确定所述用户的上网行为的潜在语义特征矩阵;
计算模块,被配置为,利用所述潜在语义特征矩阵来计算所述用户的上网行为的行为链;以及
检测模块,被配置为,根据所述行为链构建LSTM深度神经网络模型,以检测所述用户的异常上网行为。
6.根据权利要求5所述的基于潜在语义索引的上网行为分析系统,其特征在于,所述确定模块具体被配置为:
获取所述用户的历史上网日志中的URL和所述URL对应的网页文本;
基于所述URL和所述URL对应的网页文本来确定网页语义特征矩阵,所述网页语义特征矩阵用于表征所述用户的上网行为特征;以及
对所述网页语义特征矩阵进行奇异值分解和降维处理,来重构所述网页语义特征矩阵,以获得基于潜在语义空间的所述潜在语义特征矩阵;
其中,对于所述网页语义特征矩阵,矩阵行为所述网页文本中的词语,矩阵列为所述URL,矩阵值为所述词语在所述URL中出现的频次。
7.根据权利要求5所述的基于潜在语义索引的上网行为分析系统,其特征在于,所述计算模块具体被配置为:
利用所述潜在语义特征矩阵来计算所述用户的上网行为基线;以及
根据所述上网行为基线来确定所述用户的上网行为偏差,以构建所述用户的上网行为的行为链,其中所述行为链中的值为所述URL的行为偏差值。
8.根据权利要求6所述的基于潜在语义索引的上网行为分析系统,其特征在于,所述系统还包括,更新模块,被配置为,更新所述网页语义特征矩阵,将所述用户新访问的URL添加至所述网页语义特征矩阵。
9.一种存储有指令的非暂时性计算机可读介质,当所述指令由处理器执行时,执行根据权利要求1-4中任一项所述的基于潜在语义索引的上网行为分析方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明朝万达科技股份有限公司,未经北京明朝万达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011571954.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可困住野兽的LED手电筒
- 下一篇:一种对老年患者进行供氧的助行器