[发明专利]大数据的划分方法及系统在审

专利信息
申请号: 201710117775.0 申请日: 2017-03-01
公开(公告)号: CN106897443A 公开(公告)日: 2017-06-27
发明(设计)人: 马岩 申请(专利权)人: 深圳市博信诺达经贸咨询有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 深圳市科冠知识产权代理有限公司44355 代理人: 王海骏
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 划分 方法 系统
【说明书】:

技术领域

发明涉及数据处理领域,尤其涉及一种大数据的划分方法及系统。

背景技术

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

现有的大数据分类方法无法对大数据进行有效分类,导致大数据检索不方便。

发明内容

本申请提供一种大数据的划分方法。其解决现有技术的技术方案检索不方便的缺点。

一方面,提供一种大数据的划分方法,所述方法包括如下步骤:大数据的划分方法,所述方法包括如下步骤:

服务器接收需要划分的大数据;

服务器将该大数据进行分词处理得到该大数据的关键词;

服务器将该大数据按关键词的分类进行划分,并将划分后的类别标记在大数据中。

可选的,所述方法还包括:

服务器通过百度分词法或自然语言分词方法对大数据进行分词处理。

可选的,所述方法还包括:

服务器服务其将类别分为主类别和次类别,将主类别携带在大数据的头部,将次类别携带在大数据的尾部。

第二方面,提供一种大数据的划分系统,所述系统包括:

收发单元,用于接收需要划分的大数据;

处理单元,用于将该大数据进行分词处理得到该大数据的关键词,将该大数据按关键词的分类进行划分,并将划分后的类别标记在大数据中。

可选的,所述系统还包括:

处理单元,用于服务器通过百度分词法或自然语言分词方法对大数据进行分词处理。

可选的,所述系统还包括:

处理单元,用于服务其将类别分为主类别和次类别,将主类别携带在大数据的头部,将次类别携带在大数据的尾部。

第三方面,提供一种服务器,包括:处理器、无线收发器、存储器和总线,所述处理器、无线收发器、存储器通过总线连接,所述无线收发器,用于接收需要划分的大数据;

所述处理器,用于将该大数据进行分词处理得到该大数据的关键词,将该大数据按关键词的分类进行划分,并将划分后的类别标记在大数据中。

可选的,所述处理器,用于服务器通过百度分词法或自然语言分词方法对大数据进行分词处理。

可选的,所述处理器,用于服务其将类别分为主类别和次类别,将主类别携带在大数据的头部,将次类别携带在大数据的尾部。

本发明提供的技术方案依据大数据的关键词进行类别划分,所以其具有大数据检索方便的优点。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明第一较佳实施方式提供的一种大数据的划分方法的流程图;

图2为本发明第二较佳实施方式提供的一种大数据的划分系统的结构图。

图3为本发明第二较佳实施方式提供的一种服务器的硬件结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参考图1,图1是本发明第一较佳实施方式提出的一种大数据的划分方法,该方法如图1所示,包括如下步骤:

步骤S101、服务器接收需要划分的大数据。

步骤S102、服务器将该大数据进行分词处理得到该大数据的关键词。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市博信诺达经贸咨询有限公司,未经深圳市博信诺达经贸咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710117775.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top