[发明专利]场所之间关联度的评估方法和评估系统有效
申请号: | 201811115249.1 | 申请日: | 2018-09-25 |
公开(公告)号: | CN109447114B | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 李鹏;陆承恩 | 申请(专利权)人: | 北京酷云互动科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 彭瑞欣;汪源 |
地址: | 100007 北京市东城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 场所 之间 关联 评估 方法 系统 | ||
本发明公开了一种场所之间关联度的评估方法和评估系统,其中该评估方法包括:获取在预设时间段内各场所对应的用户信息,所述用户信息包括:在所述预设时间段内在对应的所述场所出现过的各用户的身份信息和各用户对应的出现频数;根据各所述场所对应的所述用户信息,评估任意两个所述场所之间的关联度。本发明的技术方案以场所的用户信息作为数据支撑,能够客观、准确的对场所之间关联度进行评估和量化,便于后续作进一步的分析。
技术领域
本发明涉及大数据技术领域,特别涉及一种场所之间关联度的评估方法和评估系统。
背景技术
研究不同场所之间的关联性,建立场所之间的关联网,是大数据研究领域的热门方向。然而,当前对场所之间关联度的评估主要是依据人为主观感受,没有相应的数据支撑。为此,提供一种相对客观、能够真实反映场所之间关联度的评估方法,是本领域亟需解决的技术问题。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一,提出了一种场所之间关联度的评估方法和评估系统。
为实现上述目的,本发明提供了一种场所之间关联度的评估方法,包括:
获取在预设时间段内各场所对应的用户信息,所述用户信息包括:在所述预设时间段内在对应的所述场所出现过的各用户的身份信息和各用户对应的出现频数;
根据各所述场所对应的所述用户信息,评估任意两个所述场所之间的关联度。
可选地,所述预设时间段包括:若干个统计周期;
所述获取在预设时间段内各场所所对应的用户信息的步骤包括:
在每一个统计周期内,针对每一个场所,获取在该统计周期内出现于该场所的各用户的所述身份信息,并将相应用户在该统计周期内出现于该场所的出现频数记为1;
针对每一个场所,统计出在预设时间段内出现于该场所的各用户的身份信息和各用户对应的出现频数。
可选地,所述身份信息包括:相应用户所携带的移动终端的MAC 地址;
所述获取在该统计周期内出现于该场所的各用户的身份信息的步骤包括:
在该统计周期内,实时扫描位于该场所内的全部所述移动终端的MAC地址,并将扫描到的MAC地址作为相应用户的身份信息。
可选地,所述根据各所述场所对应的所述用户信息,评估任意两个所述场所之间的关联度步骤包括:
以出现频数作为特征,根据各所述场所对应的所述用户信息,生成各所述场所的特征向量;
计算待评估的两个所述场所的特征向量之间的相似度,以作为该待评估的两个所述场所之间的关联度。
可选地,所述场所的个数为J,J个所述场所对应J个所述用户信息;
所述根据各所述场所的所述用户信息,生成各所述场所的特征向量的步骤包括:
从J个所述用户信息中,剔除仅在一个所述场所中出现过的用户的所述身份信息和该用户对应的出现频数;完成数据剔除后,J个所述用户信息中总计包括I个不同用户的身份信息;
以J个不同场所作为J个文件,I个用户作为I个词,采用TF-IDF 算法提取各场所的特征向量,具体包括:
计算各用户在各场所对应的词频:
其中,tfi,j表示第i个用户在第j个场所的词频,ni,j表示在预设时间段内第i个用户在第j个场所的出现频数,i∈[1,I]且i为整数,j∈[1,J]且j为整数;
计算各用户的逆向文件频率:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京酷云互动科技有限公司,未经北京酷云互动科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811115249.1/2.html,转载请声明来源钻瓜专利网。