[发明专利]一种文件分类方法及装置有效

专利信息
申请号: 201710138149.X 申请日: 2017-03-09
公开(公告)号: CN106897454B 公开(公告)日: 2020-07-03
发明(设计)人: 赵毅强 申请(专利权)人: 北京时间股份有限公司
主分类号: G06F16/16 分类号: G06F16/16;G06F16/583;G06F16/55;G06F16/35;G06K9/62
代理公司: 北京市浩天知识产权代理事务所(普通合伙) 11276 代理人: 宋菲;刘兰兰
地址: 100089 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文件 分类 方法 装置
【说明书】:

发明公开了一种文件分类方法及装置,涉及文件分类技术领域,该方法包括:获取文件中包含的图片信息;通过预设的图片分类模型确定与图片信息相对应的图片分类结果;根据图片分类结果生成与文件相对应的文件特征向量;通过预设的文件分类模型确定与文件特征向量相对应的文件分类结果。由此可见,本发明解决了现有技术中无法根据图片内容对新闻分类的问题,取得了能够综合新闻中包含的文本和图片内容进行更加准确和更加精确的分类的有益效果。

技术领域

本发明涉及文件分类技术领域,具体涉及一种文件分类方法及装置。

背景技术

新闻,是对通过报纸、电台、广播、电视台、互联网等媒体途径所传播的信息的一种称谓,主要为对新近发生事实的报道或者新近事实变动的报道,因此,新闻的及时性显得尤为重要。在日常生活中,为了便于读者能快速找到自己所关心的新闻,需要对新闻进行分类。目前的分类一般为简单的文本筛选,或者再加入关键信息筛选,例如新闻出处、语言语种等关键信息,然后根据上述信息对新闻进行分类。上述分类方式还可以广泛应用于除新闻之外的各类文件中。

但是,发明人在实现本发明的过程中,发现在现有技术中至少存在如下问题:现有技术仅能根据新闻等文件中的文本内容进行分类。而随着社会的发展,新闻中的图片内容越来越多,而且在微博、微信等自媒体平台上,很多新闻是直接以图片形式(例如将整篇文字新闻转换成图片形式添加在微博或微信朋友圈附图中)展示,或者在新闻中加入了二维码等,而现有的新闻分类技术无法识别图片,无法根据图片内容进行新闻分类,降低了新闻分类的准确性。由此可见,现有的文件分类方式存在着分类依据单一、适用范围狭窄等诸多缺陷。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的文件分类方法和相应的装置。

根据本发明的一个方面,提供了一种文件分类方法,该方法包括:获取文件中包含的图片信息;通过预设的图片分类模型确定与图片信息相对应的图片分类结果;根据图片分类结果生成与文件相对应的文件特征向量;通过预设的文件分类模型确定与文件特征向量相对应的文件分类结果。

根据本发明的另一方面,提供了一种文件分类装置,该装置包括:获取模块,用于获取文件中包含的图片信息;图片分类模块,用于通过预设的图片分类模型确定与图片信息相对应的图片分类结果;特征向量模块,用于根据图片分类结果生成与文件相对应的文件特征向量;文件分类模块,用于通过预设的文件分类模型确定与文件特征向量相对应的文件分类结果。

根据本发明提供的文件分类方法及装置,能够通过预设的图片分类模型确定与文件中包含的图片信息相对应的图片分类结果,并根据该图片分类结果对文件进行分类,由此解决了现有的文件分类方式仅能根据单一的文本特征进行分类所导致的分类结果不准确的问题,进而提升了分类结果的准确度,拓宽了本方案的适用范围。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明实施例一提供的一种文件分类方法的流程图;

图2示出了本发明实施例二提供的一种文件分类方法的流程图;

图3示出了本发明实施例三提供的一种文件分类装置的结构示意图;

图4示出了本发明实施例四提供的一种文件分类装置的结构示意图。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京时间股份有限公司,未经北京时间股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710138149.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top