[发明专利]针对新闻事件的聚合提取方法及装置有效
申请号: | 201610303436.7 | 申请日: | 2016-05-10 |
公开(公告)号: | CN106021351B | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 李华基 | 申请(专利权)人: | 深圳职业技术学院 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/953;G06F17/27 |
代理公司: | 广州市南锋专利事务所有限公司 44228 | 代理人: | 郑学伟;叶利军 |
地址: | 518054 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种针对新闻事件的聚合提取方法及装置,其中,该方法包括获取各个新闻源的新闻;对来自不同新闻源的所述新闻两两之间进行相关度计算,当相关度大于设定值时,将两新闻确定为针对同一事件的新闻并建立一事件新闻组,相关联的两新闻位于同一事件新闻组;对同一事件新闻组内各个新闻的文本内容进行汇编形成针对同一事件不同新闻源的文本内容集,并将该文本内容集加载至同一网页页面;所述文本内容包括新闻标题及正文;根据用户发出的访问请求,打开网页页面展示同一事件不同新闻源的文本内容集。本发明提高用户从网络上获取新闻信息的准确性以及用户浏览新闻的效率。 | ||
搜索关键词: | 针对 新闻 事件 聚合 提取 方法 装置 | ||
【主权项】:
1.一种针对新闻事件的聚合提取方法,其特征在于,包括:获取各个新闻源的新闻;对来自不同新闻源的所述新闻两两之间进行相关度计算,当相关度大于设定值时,将两新闻确定为针对同一事件的新闻并建立一事件新闻组,相关联的两新闻位于同一事件新闻组;对同一事件新闻组内各个新闻的文本内容进行汇编形成针对同一事件不同新闻源的文本内容集,并将该文本内容集加载至同一网页页面;所述文本内容包括新闻标题及正文;根据用户发出的访问请求,打开网页页面展示同一事件不同新闻源的文本内容集;所述根据用户发出的访问请求,打开网页页面展示同一事件不同新闻源的文本内容集之前还包括:根据新闻内容的真实性对同一新闻组内各个新闻的文本内容依次排序,具体包括:获取政府职能机构网站上公告信息及公告时间;采用词汇共现算法查找来自所述政府职能机构网站上公告信息与所述新闻中的第二共现词汇和/或句子;引入词典语义分析所述第二共现词汇和/或句子之间的相关关系;将所述新闻中的新闻发布时间与所述公告信息的公告时间进行比较,确定新闻发布时间与公告时间的相关关系;根据所述第二共现词汇和/或句子之间的相关关系及所述新闻发送时间与公告时间的相关关系计算所述新闻与所述公告信息之间的相关度;根据所述新闻与所述公告信息之间的相关度大小,对同一事件新闻组内各个新闻的文本内容在同一网页页面上进行依次排序。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳职业技术学院,未经深圳职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610303436.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种web页面缓存方法
- 下一篇:固定信息查询系统