[发明专利]基于特定区域的活跃人员、常驻人员的分析方法及系统有效
申请号: | 202010356697.1 | 申请日: | 2020-04-29 |
公开(公告)号: | CN111680059B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 张旭;梁汝锋;刘春阳;刘正阳;刘巨安 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;北京蓝光汇智网络科技有限公司 |
主分类号: | G06F16/245 | 分类号: | G06F16/245;G06F16/9536;G06F21/31 |
代理公司: | 北京远大卓悦知识产权代理有限公司 11369 | 代理人: | 卞静静 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特定 区域 活跃 人员 常驻 分析 方法 系统 | ||
本发明公开了一种基于特定区域的活跃人员、常驻人员的分析方法,其包括:S1、采集特定区域内的账户信息;S2、对账户信息进行去重;根据人员记录库中的账户信息更新人员统计库中的账户ID、账户的出现时间、账户所在地的经纬度以及账户的出现次数;S3、基于人员统计库,将出现次数排名靠前的账户标识为活跃人员;S4、基于人员记录库,从活跃人员中分别过滤出有效人员、稳定人员,有效人员和稳定人员的并集为常驻人员。本发明可有效地统计和识别出某个特定区域的社交渠道上的活跃人员和常驻人员,进而实现更加高效和多方面的支持网络舆情的分析工作。
技术领域
本发明涉及计算机信息技术领域。更具体地说,本发明涉及一种基于特定区域的活跃人员、常驻人员的分析方法及系统。
背景技术
当今社会,互联网发展十分迅速,导致网民的数量急剧上升。随着网民数量的上升,互联网越来越成为人们获取信息的主要途径,一些有影响力的门户网站,博客,社交工具逐渐变得越来越受欢迎。
众多社交工具成为受人们欢迎的交流方式之一。在互联网上,世界各地的信息每天都在以惊人的速度增长,如何实现对特定区域互联网上海量信息的抓取和分析成为人们研究网络舆情的重要难题。在技术领域上,目前特定区域社交工具信息的采集技术已趋于成熟,而对于特定区域活跃人员以及其中常驻人员的分析却缺乏比较科学的方法,所以需要一种关于特定区域活跃用户以及其中常驻人员分析的方法。
发明内容
本发明的一个目的是解决至少上述问题,并提供至少后面将说明的优点。
本发明还有一个目的是提供一种基于特定区域的活跃人员、常驻人员的分析方法及装置,其可以有效地统计和识别出某个特定区域的社交渠道上的活跃人员和常驻人员,进而实现更加高效和多方面的支持网络舆情的分析工作。
为了实现根据本发明的这些目的和其它优点,提供了一种基于特定区域的活跃人员、常驻人员的分析方法,其包括:
S1、采集特定区域内的社交渠道上的所有出现的账户信息;
S2、对账户信息进行去重,并将去重后的账户信息存储至人员记录库中;根据人员记录库中的账户信息更新人员统计库中的账户ID、账户的出现时间、账户所在地的经纬度以及账户的出现次数;账户信息至少包括账户ID、账户所在地的经纬度以及被采集时间;
S3、基于人员统计库,将账户按出现次数从高到低的顺序进行排名;将出现次数排名靠前的账户标识为活跃人员;
S4、基于人员记录库,从活跃人员中分别过滤出有效人员、稳定人员,有效人员和稳定人员的并集为常驻人员;
有效人员、稳定人员的过滤具体为:
S41、统计活跃人员对应的账户的每天出现的最早时间和最晚时间,计算最早时间和最晚时间的时间间隔,并记为停留时长;
S42、对于任一活跃人员:若一定时间段内平均每天的停留时长大于第一预设值时,则将该活跃人员标识为有效人员;
S43、若一定时间段内每天停留时长大于第一预设值的天数大于第二预设值时,则将该活跃人员标识为稳定人员;有效人员和稳定人员的并集为常驻人员。
优选的是,基于特定区域的活跃人员、常驻人员的分析方法,还包括:计算常驻人员在一定时间段内出现的平均最早时间a和平均最晚时间b,若a与b形成的时间区间位于同一天的上午7时到下午19时之间的时长,和a与b形成的时间区间的总时长的比值大于0.5时,则将该常驻人员标识为白天人员。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;北京蓝光汇智网络科技有限公司,未经国家计算机网络与信息安全管理中心;北京蓝光汇智网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010356697.1/2.html,转载请声明来源钻瓜专利网。