[发明专利]一种公共事件采集系统及方法在审
申请号: | 202010477910.4 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111581260A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 莫紫霄 | 申请(专利权)人: | 重庆木舌科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/9537;G06Q10/04;G06Q50/26 |
代理公司: | 重庆强大凯创专利代理事务所(普通合伙) 50217 | 代理人: | 陈家辉 |
地址: | 400060 重庆市南*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 公共 事件 采集 系统 方法 | ||
1.一种公共事件采集系统,其特征在于,包括:
存储单元,用于存储监控渠道;
采集单元,用于在存储单元内的监控渠道上进行舆情的数据采集;
数据整合单元,用于将采集的数据进行处理,得到时间序列数据,时间数列数据包括发布时间和发布数量;
建模单元,用于根据时间序列数据构建对应的时间序列分析模型;
分析单元,用于根据时间序列分析模型对舆情进行演化分析和预测。
2.根据权利要求1所述的公共事件采集系统,其特征在于:数据整合单元包括筛分子单元、二次提取单元和整合子单元;
筛分子单元用于根据预设的话题识别模型,从采集的话题数据中,识别衍生话题;
二次提取单元,用于根据识别的衍生话题提取对应的衍生话题关键词;
整合子单元,用于根据提取的衍生话题关键词以及采集的对应衍生话题的采集时间,整合得到时间序列数据。
3.根据权利要求2所述的公共事件采集系统,其特征在于:整合子单元还用于按照预设的频率更新时间序列数据。
4.根据权利要求2所述的公共事件采集系统,其特征在于:筛分子单元中,预设的话题识别模型由WordRank词向量模型和K-means聚类算法构建而成。
5.根据权利要求1所述的公共事件采集系统,其特征在于:建模单元构建的时间序列分析模型为ARIMA模型。
6.根据权利要求5所述的公共事件采集系统,其特征在于:建模单元包括预处理子单元、形式子单元和构建子单元;
预处理子单元用于通过单位根检验和差分转化,将非平稳序列的时间序列数据转换为平稳序列;
形式子单元用于根据预处理后的时间序列数据,进行自相关分析和偏相关分析,得到自相关系数及偏相关系数,并根据自相关系数和偏相关系数确定ARIMA模型的形式;
构建子单元用于根据模型拟合度确定ARIMA模型的系数及滞后阶数,完成ARIMA模型的构建。
7.根据权利要求6所述的公共事件采集系统,其特征在于:构建子单元确定的ARIMA模型的系数包括自回归项数P,差分系数d和移动平均项数q。
8.根据权利要求1所述的公共事件采集系统,其特征在于:存储单元内还存储有舆情管控预案库;还包括匹配单元,用于根据分析单元的分析结果,在舆情管控预案库中匹配出对应的预案。
9.根据权利要求1所述的公共事件采集系统,其特征在于:存储单元还用于更新监控渠道。
10.一种公共事件采集方法,其特征在于:使用上述权利要求1-9任一项的公共事件采集系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆木舌科技有限公司,未经重庆木舌科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010477910.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服装布料晾晒装置
- 下一篇:一种数字式伺服放大器及放大方法