[发明专利]一种行为大数据自动化采集系统有效

专利信息
申请号: 202110548065.X 申请日: 2021-05-19
公开(公告)号: CN113239274B 公开(公告)日: 2022-05-17
发明(设计)人: 贾博文;尹立航;陈月阳;付宁娴;段韶鹏;杨贝贝 申请(专利权)人: 郑州信息科技职业学院
主分类号: G06F16/9535 分类号: G06F16/9535;G06F11/34;G06K9/62
代理公司: 西安铭泽知识产权代理事务所(普通合伙) 61223 代理人: 张举
地址: 450000 河南省郑州市金*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 行为 数据 自动化 采集 系统
【说明书】:

发明公开了一种行为大数据自动化采集系统,包括网页采集模块,用于记录用户所浏览的网页;网页缓存模块将用户在一定时间内所浏览的网页根据浏览的时间顺序依次进行记录,每一个网页均对应的一个浏览时间;网页计数模块用于将网页缓存模块中的网页转化为网页数据;数字排列模块将网页缓存模块中所有网页数据进行排列得到网页数组;性格输出模块将网页数组输入到支持向量机中输出得到用户性格;网页推荐模块根据性格输出模块输出模块得到的用户性格,将网页推送给用户。本发明使用数组的方式将用户的访问顺序进行记录,并连同访问的时间一并使用支持向量机进行训练,得到输出的用户性格,从而完成对于用户性格的采集。

技术领域

本发明涉及数据采集领域,特别涉及一种行为大数据自动化采集系统。

背景技术

大数据是目前高科技时代的产物,是对海量的数据进行处理,最终得到想要的结果,其中一种表现方式就是在访问互联网的时候,为用户推荐其感兴趣的内容。在推荐之前,会实现收集用户对于互联网的访问情况,在根据访问情况得到用户的喜好,最后根据用户的喜好推荐合适的内容,使得增加用户的有效浏览量,提升用户访问互联网的体验。目前,在对用户的对于互联网的访问情况进行收集的时候,是将用户所访问的网页的类型进行存储,在根据存储网页的类型的数量判断用户的喜好,但是这样的方式对于网页浏览的先后顺序没有任何的体现,也就是说,这样只能得到用户的喜好,并不能得到用户的性格,而在进行推荐的时候,每一个网页的标签都会包括用户的性格和用户的喜好两个属性,这样使用单一的属性进行推荐就会使得推荐的并不准确,严重的时候还会造成用户体验的降低。而如果根据访问的顺序将网页的连接已经网页的类型进行存储,这样就会需要大量的缓存空间,这样就会使得在互联网运行的时候,非常的缓慢,仍然会降低用户的体验。

发明内容

本发明的目的是克服上述现有技术中存在的问题,提供一种行为大数据自动化采集系统,使用数组的方式将用户的访问顺序进行记录,并连同访问的时间一并使用支持向量机进行训练,得到输出的用户性格,从而完成对于用户性格的采集。

为此,本发明提供一种行为大数据自动化采集系统,包括:

网页采集模块,用于监控用户对网站的访问,并记录用户所浏览的网页;

网页缓存模块,将用户在一定时间内所浏览的网页根据浏览的时间顺序依次进行记录,每一个网页均对应的一个浏览时间;

网页计数模块,用于将所述网页缓存模块中的每一个网页在数据库中查找其网页编号,同时将该网页所对应的浏览时间数字化得到数字时间,并将所述编号和所述数字时间组合得到网页数据;

所述数据库,用于接收网页并反馈其所对应的网页编号;

数字排列模块,将所述网页缓存模块中所有网页数据进行排列,得到网页数组;

性格输出模块,将所述网页数组输入到支持向量机中,输出得到用户性格;

网页推荐模块,根据所述性格输出模块输出模块得到的用户性格,网页的标签中与该用户性格一致的网页推送给用户。

进一步,所述数据库在接收网页并反馈对应的网页编号的时候,包括如下步骤:

接收要获取网页编号的网页;

将网页提取所述网页的链接;

将所述链接根据设定的规则进行拆解,得到多个依次排列的字符串;

依次将每一个字符串数字化,使得每一个字符串对应一个数字;

将依次得到的数字作为所述网页编号进行输出。

更进一步,将字符串数字化的时候,包括如下步骤:

将所述字符串进行拆解,得到依次排列的字符;

获取每一个字符所对应的数字;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州信息科技职业学院,未经郑州信息科技职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110548065.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top