[发明专利]一种计算事件热度系统及方法在审
申请号: | 202111210594.5 | 申请日: | 2021-10-18 |
公开(公告)号: | CN113946736A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 朱旭琪;王欢;夏茂晋 | 申请(专利权)人: | 北京清博智能科技有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9535;G06F16/33;G06F16/35 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100095 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算 事件 热度 系统 方法 | ||
1.一种计算事件热度系统,其特征在于,包括数据获取模块、信息存储模块、数据分类模块、热度计算模块、数据生成模块;
所述数据获取模块用于使用爬虫技术从互联网爬取海量内容,并将内容发送至信息存储模块;
所述信息存储模块用于对获取的海量内容信息进行储存管理,建立大数据库;
所述数据分类模块用于提取信息储存模块中的的数据,对海量内容文本做主题聚合计算,生成各个事件集合,为热的计算模块提供可用的待分析数据集合;
所述热度计算模块用于在不同时间对数据源、数据内容声量、时间声量三个维度进行组合计算,得出热度综合分值和时新度综合分值;
所述数据生成模块根据热度综合分值和时新度综合分值的结合生成用于据以形成行榜单数据。
2.根据权利要求1所述的一种计算事件热度系统,其特征在于,所述数据获取模块用于采集文本信息、评论次数、转发次数、用户基本信息、用户评论互动信息并发送至信息存储模块。
3.根据权利要求1所述的一种计算事件热度系统,其特征在于,所述数据分类模块用于提取数据库中的用户基本信息、用户评论互动信息生成文本信息数据源A,文本信息生成数据内容声量B,评论次数、转发次数生成事件声量C,对得到的数据以小时为单位,统计各个时间段内数据源A、内容声量B、事件声量C。
4.根据权利要求1所述的一种计算事件热度方法,其特征在于,所述方法包括以下步骤:
S1、进行热点事件新闻和用户信息采集,利用爬虫技术从互联网爬取海量内容,获取到待计算的新闻热点信息、内容转发次数、内容评论次数、用户基本信息、文本信息,并将内容发送至信息存储模块;
S2、数据分类模块用于提取数据库中的用户基本信息、用户评论互动信息生成文本信息数据源A,文本信息生成数据内容声量B,评论次数、转发次数生成事件声量C,对得到的数据以小时为单位,统计各个时间段内数据源A、内容声量B、事件声量C,然后按照组合公式H=λ1A+λ2B+λ3C构成成业务场景的热度指数模型,也可以进一步对各集合的该值进行标准化处理,统计每个来源的内容在第一预设时间段内的第一操作统计数据和在第二预设时间段内的第二操作统计数据,得出热度综合分值和时新度综合分值;
S3、生成模块根据热度综合分值和时新度综合分值的结合生成用于据以形成行榜单数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京清博智能科技有限公司,未经北京清博智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111210594.5/1.html,转载请声明来源钻瓜专利网。