[发明专利]一种展示新闻事件的可视化方法有效
申请号: | 201810175268.7 | 申请日: | 2018-03-02 |
公开(公告)号: | CN108376175B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 范艳艳 | 申请(专利权)人: | 成都睿码科技有限责任公司;杭州数峰科技有限公司 |
主分类号: | G06F16/957 | 分类号: | G06F16/957;G06F16/951 |
代理公司: | 成都君合集专利代理事务所(普通合伙) 51228 | 代理人: | 张鸣洁 |
地址: | 610041 四川省成都市自由贸易*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 展示 新闻 事件 可视化 方法 | ||
本发明公开了一种展示新闻事件的可视化方法,包括:从后台数据库获取新闻,所述新闻包括新闻ID、新闻标题、新闻内容、新闻声量和新闻所属TopicID,抽取新闻所属TopicID相同的新闻簇即新闻事件,其中,新闻总数为M,新闻事件总数为N,M≤N;将所述新闻事件数值化;将数值化后的新闻标题、新闻内容和新闻事件降维;计算新闻事件的热力值,在二维平面绘制新闻事件的坐标,新闻事件对应的像素点的热力值即为新闻事件的声量总和;采用绘图工具包将每个像素点转化为不同的颜色,最终形成新闻事件热力图。本发明在新闻事件聚类的基础上,将新闻事件向量化并降维处理后映射到二维平面上,形成新闻事件的热力图,可以直观的看到新闻事件的热度及相关性。
技术领域
本发明涉及新闻信息技术领域,具体的说,是一种展示新闻事件的可视化方法。
背景技术
新闻,它是对新近发生的有社会意义并引起公众兴趣的事实的简短报道。除了传统媒介之外,网络也是新闻传播的一个重要媒介。目前,网络作为媒介传播新闻时,一般都是由各个新闻媒体将新闻发布在自己网站或频道上。大众通过关键词搜索可以看到与关键词相关的新闻,由于这些新闻的来源不同,即使新闻关键词相关,却并不能确定这些新闻都是针对同一事件新闻,因此,在这些铺天盖地的信息,大众很难从中挑选针对某一事件的新闻,极大地影响了用户阅读新闻的效率及获取新闻信息的准确性,也无法直观的看到新闻事件的热度和相关性。
发明内容
本发明的目的在于提供一种展示新闻事件的可视化方法,用于解决现有技术中用户无法直观看到新闻事件的热度和相关性的问题。
为了达到上述目的,本发明通过下述技术方案实现:
一种展示新闻事件的可视化方法,包括:
步骤S100:从后台数据库获取新闻,所述新闻包括新闻ID、新闻标题、新闻内容、新闻声量和新闻所属TopicID,抽取新闻所属TopicID相同的新闻簇即新闻事件,其中,新闻总数为M,新闻事件总数为N,M≧N;
步骤S200:将所述新闻事件数值化;
步骤S300:将数值化后的新闻标题、新闻内容和新闻事件降维;
步骤S400:计算新闻事件的热力值,在二维平面绘制新闻事件的坐标,新闻事件对应的像素点的热力值即为新闻事件的声量总和;
步骤S500:采用绘图工具包matplotlib,将每个像素点转化为不同的颜色,最终形成新闻事件热力图。
工作原理:
后台数据库通过动态网页抓取新闻数据,包括新闻ID、新闻标题、新闻内容、新闻声量和新闻所属TopicID,然后从新闻数据中抽取新闻事件;将新闻事件进行数值化处理,将新闻事件、新闻标题和新闻内容的文本分别训练成数值向量,数值向量的长度为可调整的参数,在这里取300维。然后将数值化后的新闻事件、新闻标题和新闻内容作降维处理,将300维降为二维或者三维,这里采用降为二维。然后在二维平面上计算各个新闻事件的坐标点,相关度稿的新闻事件在二维平面的距离越近,热力值即新闻事件的声量总和,新闻事件的声量即评论人数,因此,从新闻事件的声量总和,可以反映出新闻事件的受关注程度,因此新闻事件越受关注,热力值越大,则该新闻事件的像素点越大,则反映出辐射能力越强,则该新闻事件的亮度越高。不同新闻事件的热力值不同,则对应的该坐标点的像素点不同,即辐射能力不同。采用绘图工具包matplotlib,将每个像素点转化为不同的颜色,最终形成新闻事件热力图,从像素点的颜色可以区分新闻事件的受关注程度,从新闻事件的距离,可以看出新闻事件的相关度,更加直观的展示新闻事件的热度和相关度。
进一步地,所述步骤S100具体包括:
步骤S110:获取新闻,其中包括新闻ID,新闻标题和新闻内容;
步骤S120:从新闻内容中抽取新闻摘要,并分别将新闻标题和新闻内容进行数值化转换;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都睿码科技有限责任公司;杭州数峰科技有限公司,未经成都睿码科技有限责任公司;杭州数峰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810175268.7/2.html,转载请声明来源钻瓜专利网。