[发明专利]一种移动群智感知中社会事件的总结方法有效
申请号: | 201510227482.9 | 申请日: | 2015-05-03 |
公开(公告)号: | CN104850606B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 郭斌;於志文;皇甫深龙;陈荟慧;王柱 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/35;G06F17/27;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710072 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 移动 感知 社会 事件 总结 方法 | ||
1.一种移动群智感知中社会事件的总结方法,其特征在于,包括如下步骤:
S1、在某个社会性事件发生之前,设置一些用户在使用移动社交网络发布与该事件相关信息时可能会使用的一些关键词;
S2、在社会性事件发生时,利用移动社交网络的数据接口,采集包含指定关键词的感知信息;
S3、在得到全部的感知信息之后,从中选取信息发布地点与事件发生地点相吻合的感知信息;
S4、根据每个用户发布的感知信息数量进行排序,选取发布信息个数大于阈值n1的用户作为研究对象;
S5、提取信息中的用户、时间、正文三个字段,对正文进行预处理,删除噪音数据:表情符、标签符、用户名,只保留与正文相关的文本信息;
S6、对于每一条感知信息,利用自然语言处理中的词性标注提取具有名词形式的词,利用命名实体辨识提取有特定意义的实体,并将上述提取结果统一作为该条信息的关键词;
S7、从全体用户发布的信息中提取出关键词之后,选取使用频率最高的n2个关键词作为研究对象;
S8、以第一条感知信息发出的时间作为开始时间,以最后一条感知信息发出的时间作为结束时间,将全体时间T均匀地划分为J个时间段;
S9、以时间、用户和关键词为三个维度,构建张量,如果用户ui在时间tj发表的感知信息正文中包含关键词wk,则在所构建的张量中,对应的元素mijk为1,否则为0;
S10、在张量构建完成之后,利用Tensorlab中的工具对张量进行Tucker张量分解计算,得到在时间、用户和关键词三个维度上的因子矩阵;
S11、在得到三个维度的因子矩阵之后,利用K-means聚类算法对因子矩阵进行行聚类,得聚类结果;
S12、分析聚类结果,得结果。
2.根据权利要求1所述的一种移动群智感知中社会事件的总结方法,其特征在于,所述步骤S10中分解计算的公式为:
M≈[G;U,T,W]=G×1U×2T×3W
其中,M∈RI×J×K,U∈RI×N,T∈RJ×N,W∈RK×N;I为参与的用户数量;J为时刻个数;K为关键词的个数;G为核心张量;U,T,W为在时间、用户和关键词三个维度上的因子矩阵。
3.根据权利要求1所述的一种移动群智感知中社会事件的总结方法,其特征在于,S12所得的结果包括在该社会事件中具有较大影响力的用户,这些用户对该社会事件贡献了较多有价值的信息;事件发展过程中一系列重要时刻,这些时刻与事件发展的不同阶段相关;一系列的关键词,这些关键词用来对事件的发展过程进行描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510227482.9/1.html,转载请声明来源钻瓜专利网。