[发明专利]一种网络论坛小群体确定方法及系统有效
申请号: | 201711469236.X | 申请日: | 2017-12-29 |
公开(公告)号: | CN108182639B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 姚俊萍;李晓军;沈涛;李新社 | 申请(专利权)人: | 中国人民解放军火箭军工程大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F16/953 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 周新楣 |
地址: | 710000 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 论坛 群体 确定 方法 系统 | ||
1.一种网络论坛小群体确定方法,其特征在于,所述方法包括:
从多个目标网络论坛中获取每个所述目标网络论坛中的目标网络论坛文本,每个所述目标网络论坛文本均包括发帖时间、发帖题目、发帖作者、所述发帖的所有跟帖以及所述所有跟帖的作者;
提取每个所述目标网络论坛文本的所述发帖作者的用户名以及所述所有跟帖的作者的用户名,得到多个用户成员,所述多个用户成员构成每个所述目标网络论坛文本的用户成员集合;
将所述用户成员集合按预设阈值进行组合,得到多组用户成员集合组,所述预设阈值为每个所述用户成员集合组中的所述用户成员集合的个数,所述预设阈值大于或等于2;
在每个用户成员集合组中获取所有用户成员集合中相同的用户成员;
在每个用户成员集合组中判断所述相同的用户成员的个数是否大于预设的用户成员个数,所述预设的用户成员个数大于或等于2;
若所述相同的用户成员的个数大于所述预设的用户成员个数,则将所述相同的用户成员构成的集合确定为网络论坛小群体。
2.根据权利要求1所述的一种网络论坛小群体确定方法,其特征在于,所述从多个目标网络论坛中获取每个所述目标网络论坛中的目标网络论坛文本,具体包括:
依据预设主题,对网络论坛数据进行检索,获取关键词集合;
依据所述关键词集合从多个目标网络论坛中获取每个所述目标网络论坛中的目标网络论坛文本。
3.根据权利要求2所述的一种网络论坛小群体确定方法,其特征在于,所述依据所述关键词集合从多个目标网络论坛中获取每个所述目标网络论坛中的目标网络论坛文本,具体包括:
依据所述关键词集合,利用数据检索工具从多个目标网络论坛中抓取多个目标网络论坛文本数据;
依据所述多个目标网络论坛文本数据,得到每个所述目标网络论坛中的目标网络论坛文本。
4.根据权利要求1所述的一种网络论坛小群体确定方法,其特征在于,所述在每个用户成员集合组中获取所有用户成员集合中相同的用户成员,具体包括:
计算每个用户成员集合组中多个所述用户成员集合的交集,所述交集中的每个元素表示一个相同的用户成员。
5.一种网络论坛小群体确定系统,其特征在于,所述系统包括:
文本获取模块,用于从多个目标网络论坛中获取每个所述目标网络论坛中的目标网络论坛文本,每个所述目标网络论坛文本均包括发帖时间、发帖题目、发帖作者、所述发帖的所有跟帖以及所述所有跟帖的作者;
用户名提取模块,用于提取每个所述目标网络论坛文本的所述发帖作者的用户名以及所述所有跟帖的作者的用户名,得到多个用户成员,所述多个用户成员构成每个所述目标网络论坛文本的用户成员集合;
组合模块,用于将所述用户成员集合按预设阈值进行组合,得到多组用户成员集合组,所述预设阈值为每个所述用户成员集合组中的所述用户成员集合的个数,所述预设阈值大于或等于2;
用户成员获取模块,用于在每个用户成员集合组中获取所有用户成员集合中相同的用户成员;
判断模块,用于在每个用户成员集合组中判断所述相同的用户成员的个数是否大于预设的用户成员个数,所述预设的用户成员个数大于或等于2;
小群体确定模块,用于若所述相同的用户成员的个数大于所述预设的用户成员个数,则将所述相同的用户成员构成的集合确定为网络论坛小群体。
6.根据权利要求5所述的一种网络论坛小群体确定系统,其特征在于,所述文本获取模块,具体包括:
关键词集合获取单元,用于依据预设主题,对网络论坛数据进行检索,获取关键词集合;
文本获取单元,用于依据所述关键词集合从多个目标网络论坛中获取每个所述目标网络论坛中的目标网络论坛文本。
7.根据权利要求6所述的一种网络论坛小群体确定系统,其特征在于,所述文本获取单元,具体包括:
文本数据获取子单元,用于依据所述关键词集合,利用数据检索工具从多个目标网络论坛中抓取多个目标网络论坛文本数据;
文本获取子单元,用于依据所述多个目标网络论坛文本数据,得到每个所述目标网络论坛中的目标网络论坛文本。
8.根据权利要求5所述的一种网络论坛小群体确定系统,其特征在于,所述用户成员获取模块,具体包括:
计算单元,用于计算每个用户成员集合组中多个所述用户成员集合的交集,所述交集中的每个元素表示一个相同的用户成员。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军火箭军工程大学,未经中国人民解放军火箭军工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711469236.X/1.html,转载请声明来源钻瓜专利网。