[发明专利]一种监测展示互联网热点的方法有效
申请号: | 200910086470.3 | 申请日: | 2009-06-15 |
公开(公告)号: | CN101923544A | 公开(公告)日: | 2010-12-22 |
发明(设计)人: | 郑昀 | 申请(专利权)人: | 北京百分通联传媒技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京方韬法业专利代理事务所 11303 | 代理人: | 岳亚 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监测 展示 互联网 热点 方法 | ||
技术领域
本发明涉及互联网热点自动发现技术领域,尤其涉及一种监测展示互联网热点的方法。
背景技术
在热点自动发现(meme Tracker)的技术领域中,meme是一种对流行文化基因的隐喻,meme Tracker是指对互联网(潜在)流行趋势和热点的实时追踪和监测系统。
互联网新闻的meme Tracker,可以追溯到Google News。随后在中国出现了同一模式的百度新闻。简单的说,他们都是通过检测不同权威新闻源的文章重复度来获知哪些新闻是重要的。
互联网社会化媒体的meme Tracker,可以追溯到TechMeme。它是2005年出现的监测博客和新闻媒体的网站。站方选择好要监控的信源,其中博客权重很高。它通过计算博客、新闻之间的链接指向,以及语义关联,可以近乎实时地找到当前科技界讨论最热的话题。由于事先选择的是优质的信息源,而且文章会按照复杂的公式计算权重,能做到相对重要和优质的文章列在话题最前面,所以阅读质量非常高。
随后,在Google Reader统治了RSS阅读器领域之后,诞生了监控GoogleReader Shared Items的新兴网站:RssMeme,它统计Google Reader用户分享的阅读,通过分享次数统计,可以得到一个热文榜单。
Twitter作为社会化媒体新锐力量大行其道后,很多网站开始追踪Twitter上的推荐链接,其中最出色的是TweetMeme。这类memeTracker也是统计链接被不同的Twitter用户推荐过的次数,并按照达到预置阈值上榜的时间排序,最新的热门链接排在最前面。
基本上围绕着监测博客、RSS阅读、微博客等社会化媒体用户行为,相继诞生了为数不少的meme Tracker网站,都从不同维度反映了互联网在流行什么热门资讯。
在对社会化媒体的监控上,RssMeme的监控RSS分享模式,和TweetMeme的监控Twi iter分享模式,大致可以划分为“基于链接的传播监测和统计模式”,都是统计某一个单一社会化媒体上被不同用户推荐或分享的链接,出现的次数越多,越说明值得阅读,是潜在的热点。
这两种模式都可以对热门链接进行检测,根据链接中出现的域名关键词可以判断所引用内容是文本、视频还是图像。然后检测热门链接的标题属于什么分类,如科技、娱乐、社会等等。这样,便于分门别类地组织热点内容。
“基于链接的传播监测和统计模式”缺点是,如果大热门事件出现,那么会短时间内出现大量热门链接,其实都是讲同一件事的资讯,只不过作者或出处不同罢了。此模式无法做到将不同热门链接合并到同一个话题下,该模式不知道核心话题是什么,无法像人类一样理解热门链接的意义。此时,该模式只是加速了信息的快速流动和传播,揭示了热点的流行趋势,但没有给出一个完整的解决方案。
Google News和百度新闻的新闻聚合模式,克服了“基于链接的传播监测和统计模式”中的无法合并热门链接的缺点。它们可以通过检测不同新闻之间的内容重合度,或者不同资讯之间的链接指向,能将某一个话题的资讯合并在一起。
本新闻聚合模式,首先广泛收集新闻媒体的互联网信源,标记不同的权重度,做成扫描列表。然后通过爬虫及时抓取最新的新闻。通过对最近一段时间的新闻文章计算文本相似性,可以获知哪些文章之间相似度高于某一个预设阈值,那么说明这批文章是近似一个话题,可以合并。可以通过信源的权威度,和相似文章的数目,来确定某一批文章所对应的话题是热门话题,并按此排序。
但是这种技术方案也存在以下缺点:
转载新闻次数多,或者多个报道之间存在话题关联,这个基于文本相似性的测量维度,在没有其他测量维度的参考下,很容易给出一大堆枯燥乏味的官方新闻或通稿,并不符合普通网民的阅读习惯,除非是人工干预计算结果。
由于是基于新闻资讯的聚合,所以缺了很重要的一环:社会化媒体,从而造成无法及时发现和捕获潜在流行热点。网民中流行的大量热点,并不会很快在出现新闻媒体上,从而造成此模式无法真正反映即时(Real Time)的互联网热点。
发明内容
本发明的目的在于提出一种监测展示互联网热点的方法,能够快速监测互联网最新的热点,并有效地建立起热门关键词、热门链接、新闻、图片、视频等之间的关联,充分展示互联网热点。
为达此目的,本发明采用以下技术方案:
一种监测展示互联网热点的方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百分通联传媒技术有限公司,未经北京百分通联传媒技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910086470.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:带切痕熟食制造装置
- 下一篇:一种TD-HSUPA中HARQ的实现方法