[发明专利]群组间消息传播路径挖掘方法与系统有效
申请号: | 201710115408.7 | 申请日: | 2017-02-28 |
公开(公告)号: | CN106888159B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 刘肖凡;李正龙 | 申请(专利权)人: | 东南大学 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;G06Q50/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210096*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 群组间 消息 传播 路径 挖掘 方法 系统 | ||
本发明公开了一种基于在线社交平台群聊消息的群组间消息传播路径挖掘方法与系统,通过数据获取模块按照指定要求获取在线社交平台的群聊消息,并将获得的数据交由数据处理模块进行处理;数据处理模块将处理完成的数据按照传播事件分组保存于本地存储模块中;群聊消息传播路径构建模块从本地存储模块中提取所需数据构建消息传播路径,并将结果保存于本地存储模块中;可视化模块从本地存储模块或者消息传播路径构建模块中提取群聊消息传播路径,并以图表形式可视化展示给用户。本发明弥补了现有技术中针对特定消息在群组间的传播路径挖掘技术的缺失问题。
技术领域
本发明涉及一种基于在线社交平台群聊消息的群组间消息传播路径挖掘与构建的方法与系统,属于信息技术领域。
背景技术
在线社交软件的发展,丰富了人们之间的沟通方式。在线社交软件中的群组一般是基于一定的兴趣、目的或者交际圈所创建,而基于群组的群聊模式则可以提供一个供多人同时交换信息的平台。人类社会的社交属性导致群组与群组之间的关系往往并非是孤立的,在某些基于相同兴趣或者目的而创建的不同群组中,通常会同时包含某些相同的群成员,两个不同的群组之间便可以通过这些共同群成员建立起联系,这些共同群成员在群组间消息传播过程中扮演着桥梁的角色。
当信息在一个群内传播时,该信息可能会被某个充当桥梁角色的群成员转发到另一个群中,这便导致该信息从一个群传播到另一个群中。这种行为可能出现多次,导致该信息在群组之间传播扩散。通过挖掘与构建出消息在群组之间的传播网络,便可以对消息进行溯源,寻找扩散路径等。但目前还未有相关方法对群组间信息传播行为进行研究。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种基于在线社交平台群聊消息的群组间消息传播路径挖掘方法与系统,本方法和系统能够基于群与群之间的关系拓扑结构、群聊消息内容、群聊消息发送者和消息发送时序关系等特征,挖掘群聊消息在群组之间的传播路径。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于在线社交平台群聊消息的群组间消息传播路径挖掘方法,包括如下步骤:
步骤1:选取特定群聊消息作为传播事件传播源;
步骤2:对每一个传播源,识别并提取在线社交平台中与其内容相关的群聊消息,并保存为一个传播事件消息集合;
步骤3:对每一个传播事件消息集合,根据包括群聊消息发送时间间隔、群聊消息发送者是否为两个群之间的共同群成员在内的特征,确定每两个群聊消息之间是否具有传播关系;
步骤4:在每个具有传播关系的群聊消息对所属群之间添加消息传播关系,构建并展示消息传播路径。
具体的,所述群聊消息至少包括如特征:群组信息、群聊消息发送者、群聊消息发送时间、群聊消息发送时间间隔、群聊消息内容。
具体的,所述步骤1中,特定群聊消息定义为:对群聊消息的具体内容进行包括分词、删除停用词、删除特定词性的单词在内的预处理后,保留的单词数量大于一定阈值的群聊消息。
具体的,所述步骤1中,传播源的选取方法包括但不限于人工选取特定群聊消息方法、通过聚类算法划分不同类型消息方法等。
具体的,所述步骤2中,传播事件消息集合定义为:对某个传播源,群聊消息发送时间在传播源之后且群聊消息内容与该传播源具有一定相似度的群聊消息集合。
具体的,所述步骤2中,群聊消息与传播源的相关性通过文本相似性等算法确认。
具体的,所述步骤4中,展示消息传播路径的方式包括有向图形等形式。
一种基于在线社交平台群聊消息的群组间消息传播路径挖掘系统,包括数据获取模块、数据处理模块、本地存储模块、消息传播路径构建模块和可视化模块,其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710115408.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种即时通信方法和装置
- 下一篇:软件定义网络中基于网络域划分的路由方法