[发明专利]舆情数据的获取方法和装置在审
申请号: | 201910469895.6 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110263237A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 郭海燕 | 申请(专利权)人: | 精硕科技(北京)股份有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/953 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 张建秀;栗若木 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据抓取 方法和装置 对象发布 发布目标 申请 发布 | ||
1.一种舆情数据的获取方法,其特征在于,包括:
从舆情平台上发布的舆情数据中,选取发布目标舆情数据的用户,作为数据抓取对象;
对所述数据抓取对象发布的数据进行数据抓取,获取与所述目标舆情对应的舆情数据。
2.根据权利要求1所述的方法,其特征在于,所述选取发布目标舆情数据的用户,包括:
在所述舆情平台上获取目标舆情数据的基础舆情数据;
查询所述舆情平台上内容包括所述基础舆情数据的内容,得到包括所述基础舆情数据的内容;
记录包括所述基础舆情数据的内容的作者信息。
3.根据权利要求1所述的方法,其特征在于,所述选取发布目标舆情数据的用户,包括:
利用预先设置的关键词信息,在所述舆情平台上进行舆情内容数据的搜索,得到包括所述关键词信息的内容;
记录包括所述关键词信息的内容的作者信息。
4.根据权利要求2或3所述的方法,其特征在于,所述选取发布目标舆情数据的用户,包括如下至少一个方式:
方式一、记录对所述作者发布的内容的评论者信息;
方式二、查询所述作者发布的内容中是否还有包括所述目标舆情数据的内容;如果有包括所述目标舆情数据的第一目标内容,记录所述第一目标内容中的评论者信息;
方式三、获取所述作者参与评论的内容;从参与评论的内容中,查询是否有包括所述目标舆情数据的内容;如果有包括所述目标舆情数据的第二目标内容,记录所述第二目标内容中的目标作者;
方式四、记录对所述第二目标内容的评论者信息;
方式五、查询所述目标作者发布的内容中是否还有包括所述目标舆情数据的内容;如果有包括所述目标舆情数据的第三目标内容,记录所述第三目标内容中的评论者信息。
5.根据权利要求1所述的方法,其特征在于,所述对所述数据抓取对象发布的数据进行数据抓取,获取与所述目标舆情对应的舆情数据之后,所述方法还包括:
从获取到的舆情数据中,获取发布目标舆情数据的用户,更新到所述数据抓取对象中。
6.一种舆情数据的获取装置,其特征在于,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器用以调用所述存储器中的计算机程序以实现如下操作,包括:
从舆情平台上发布的舆情数据中,选取发布目标舆情数据的用户,作为数据抓取对象;
对所述数据抓取对象发布的数据进行数据抓取,获取与所述目标舆情对应的舆情数据。
7.根据权利要求6所述的装置,其特征在于,所述处理器用以调用所述存储器中的计算机程序以实现选取发布目标舆情数据的用户的操作,包括:
在所述舆情平台上获取目标舆情数据的基础舆情数据;
查询所述舆情平台上内容包括所述基础舆情数据的内容,得到包括所述基础舆情数据的内容;
记录包括所述基础舆情数据的内容的作者信息。
8.根据权利要求6所述的装置,其特征在于,所述处理器用以调用所述存储器中的计算机程序以实现选取发布目标舆情数据的用户的操作,包括:
利用预先设置的关键词信息,在所述舆情平台上进行舆情内容数据的搜索,得到包括所述关键词信息的内容;
记录包括所述关键词信息的内容的作者信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于精硕科技(北京)股份有限公司,未经精硕科技(北京)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910469895.6/1.html,转载请声明来源钻瓜专利网。