[发明专利]一种移动群智感知中社会事件的总结方法有效
申请号: | 201510227482.9 | 申请日: | 2015-05-03 |
公开(公告)号: | CN104850606B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 郭斌;於志文;皇甫深龙;陈荟慧;王柱 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/35;G06F17/27;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710072 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种移动群智感知中社会事件的总结方法,包括如下步骤:采集社会性事件发生时,大量用户发布的与社会性事件相关的感知信息;感知数据的预处理;用三阶张量对感知数据进行建模;利用Tucker张量分解和K‑means聚类分析对社会事件进行总结。本发明综合利用用户发布的与社会性事件相关的感知数据,来形成对社会性事件的总结,作为人们获取事件相关信息的参考。 | ||
搜索关键词: | 一种 移动 感知 社会 事件 总结 方法 | ||
【主权项】:
1.一种移动群智感知中社会事件的总结方法,其特征在于,包括如下步骤:S1、在某个社会性事件发生之前,设置一些用户在使用移动社交网络发布与该事件相关信息时可能会使用的一些关键词;S2、在社会性事件发生时,利用移动社交网络的数据接口,采集包含指定关键词的感知信息;S3、在得到全部的感知信息之后,从中选取信息发布地点与事件发生地点相吻合的感知信息;S4、根据每个用户发布的感知信息数量进行排序,选取发布信息个数大于阈值n1的用户作为研究对象;S5、提取信息中的用户、时间、正文三个字段,对正文进行预处理,删除噪音数据:表情符、标签符、用户名,只保留与正文相关的文本信息;S6、对于每一条感知信息,利用自然语言处理中的词性标注提取具有名词形式的词,利用命名实体辨识提取有特定意义的实体,并将上述提取结果统一作为该条信息的关键词;S7、从全体用户发布的信息中提取出关键词之后,选取使用频率最高的n2个关键词作为研究对象;S8、以第一条感知信息发出的时间作为开始时间,以最后一条感知信息发出的时间作为结束时间,将全体时间T均匀地划分为J个时间段;S9、以时间、用户和关键词为三个维度,构建张量,如果用户ui在时间tj发表的感知信息正文中包含关键词wk,则在所构建的张量中,对应的元素mijk为1,否则为0;S10、在张量构建完成之后,利用Tensorlab中的工具对张量进行Tucker张量分解计算,得到在时间、用户和关键词三个维度上的因子矩阵;S11、在得到三个维度的因子矩阵之后,利用K‑means聚类算法对因子矩阵进行行聚类,得聚类结果;S12、分析聚类结果,得结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510227482.9/,转载请声明来源钻瓜专利网。