[发明专利]一种基于数字报纸的资讯数据分类方法有效
申请号: | 201510104637.X | 申请日: | 2015-03-10 |
公开(公告)号: | CN104679875B | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 姚洲鹏;陈法涌;陈嘉松;吴云峰 | 申请(专利权)人: | 杭州凡闻科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州凯知专利代理事务所(普通合伙)33267 | 代理人: | 邵志 |
地址: | 310022 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于数字报纸的资讯数据分类方法。目的是提供一种基于数字报纸的资讯数据分类方法,使得采集到的数据能够自动进行分类。方案分析并提取数字报纸各版面的出版日期、版面名称、版次信息、每个版面内各篇文章的标题、肩标题、副标题、作者、正文信息、插图;将提取的信息入至数据库中,并在数据库内部建立关联关系;汇聚每种报纸一段时间内的数据,针对同一种报纸中版面名称相同的版面进行重名合并;根据报纸内容的不同设定不同的类别,在各类别下设定若干关键词,建立起类别与关键词之间的对应关系;按对应关系,将数据库中、版面名称包含某一关键词的版面内的所有文章归类至对应的类别下。本发明用于新闻资讯数据的自动分类处理。 | ||
搜索关键词: | 一种 基于 数字 报纸 资讯 数据 分类 方法 | ||
【主权项】:
一种基于数字报纸的资讯数据分类方法,其特征在于包括:A、分析并提取数字报纸各版面的出版日期、版面名称、版次信息,以及每个版面内各篇文章的标题、肩标题、副标题、作者、正文信息、插图;B、将提取的信息入至数据库中,并根据出版日期和版次信息在数据库内部建立关联关系;C、按照上述方法,利用数据库中的时间维度汇聚每种报纸一段时间内的数据,基于全文检索引擎技术,针对同一种报纸中版面名称相同的版面进行重名合并处理;D、根据报纸内容的不同设定不同的类别,然后在各类别下设定若干关键词,建立起类别与关键词之间的对应关系;E、按照步骤D的对应关系,将数据库中,版面名称包含有某一关键词的版面内的所有文章自动归类至对应的类别下。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州凡闻科技有限公司,未经杭州凡闻科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510104637.X/,转载请声明来源钻瓜专利网。