[发明专利]一种通过资讯发掘当前热点事件的方法和装置有效
申请号: | 201910861856.0 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110704603B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 陈翟翟;樊国鹏;朱留锋 | 申请(专利权)人: | 武汉灯塔之光科技有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/33;G06F16/35;G06F40/289;G06Q40/06 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 向彬 |
地址: | 430000 湖北省武汉市东湖新技术开发*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 资讯 发掘 当前 热点 事件 方法 装置 | ||
1.一种通过资讯发掘当前热点事件的方法,其特征在于,包括:
根据用户检索条件获取最近预设时间段内的多篇资讯新闻,并通过计算得到每篇资讯新闻的一个或多个关键词;
根据每篇资讯新闻对应的一个或多个关键词,计算得到每篇资讯新闻对应的资讯向量;
对各资讯向量进行聚类计算后得到一个或多个簇,对应最近预设时间段内的一个或多个热点事件,并将各热点事件展现给用户;
其中,一个簇表示一个热点事件,每个簇内包含一篇或多篇资讯新闻;
所述多篇资讯新闻是从一个或多个资讯平台获取,则在所述获取最近预设时间段内的多篇资讯新闻后,所述方法还包括:
对所述多篇资讯新闻分别进行性质分析,从中筛选出一篇或多篇预估性资讯新闻,并记录每篇预估性资讯新闻对应的资讯平台和预估结果;
通过大数据爬虫分析和/或对国家基准资讯平台进行访问,获取与每篇预估性资讯新闻相对应的关联结果;
将每篇预估性资讯新闻的预估结果与对应关联结果进行匹配,得到每篇预估性资讯新闻的准确度,进而得到对应资讯平台的可信度;
则在下一次发掘当前热点事件时,所述获取最近预设时间段内的多篇资讯新闻具体为:从可信度高于预设基准值的一个或多个资讯平台处,获取最近预设时间段内的多篇资讯新闻。
2.根据权利要求1所述的通过资讯发掘当前热点事件的方法,其特征在于,所述根据用户检索条件获取最近预设时间段内的多篇资讯新闻,并通过计算得到每篇资讯新闻的一个或多个关键词,具体包括:
根据用户输入的检索条件,从一个或多个资讯平台获取最近预设时间段内的多篇资讯新闻,并对各资讯新闻进行清洗,去除无用标签和脏数据;
分别对每篇资讯新闻中的文本进行分词操作,去除无效词,并在剩下的词汇中选取一个或多个词汇作为本篇资讯新闻的关键词;
其中,所述检索条件包括近期时间节点、热度星级和检索词中的一项或多项;所述无效词包括停用词、脏词和噪音词中的一项或多项。
3.根据权利要求2所述的通过资讯发掘当前热点事件的方法,其特征在于,所述在剩下的词汇中选取一个或多个词汇作为本篇资讯新闻的关键词,具体为:
对于剩下的每个词汇,将该词汇在全资讯中出现的概率和在本篇新闻资讯中出现的概率进行比较;如果该词汇在本篇新闻资讯中出现的概率高于在全资讯中出现的概率,则将该词汇作为本篇资讯新闻的一个关键词。
4.根据权利要求1所述的通过资讯发掘当前热点事件的方法,其特征在于,所述根据每篇资讯新闻对应的一个或多个关键词,计算得到每篇资讯新闻对应的资讯向量,具体为:
根据每篇资讯新闻对应的一个或多个关键词,获取每篇资讯新闻对应的一个或多个关键词向量;
对于每篇资讯新闻,将其对应的各关键词向量线性相加,得到本篇资讯新闻对应的资讯向量。
5.根据权利要求1所述的通过资讯发掘当前热点事件的方法,其特征在于,所述对各资讯向量进行聚类计算后得到一个或多个簇,具体为:
对于每个资讯向量,将资讯向量标记到高维空间中后分别计算该资讯向量与每个簇中心的夹角余弦值,并与预设阈值进行比较;
根据比较结果判断每篇资讯新闻合适的簇,并基于判断结果分别将各资讯新闻加入其合适的簇中,最终得到一个或多个簇。
6.根据权利要求5所述的通过资讯发掘当前热点事件的方法,其特征在于,所述根据比较结果判断每篇资讯新闻合适的簇,并基于判断结果分别将各资讯新闻加入其合适的簇中,具体为:
对于每个资讯向量,如果该资讯向量与任一个簇中心的夹角余弦值大于预设阈值,则将本篇资讯新闻加入到该簇中,并重新计算簇心;
如果该资讯向量与每个簇中心的夹角余弦值都小于等于预设阈值,则将本篇资讯新闻作为一个新簇加入到簇列表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉灯塔之光科技有限公司,未经武汉灯塔之光科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910861856.0/1.html,转载请声明来源钻瓜专利网。