[发明专利]一种基于个性化标签体系的主题库生成方法有效
申请号: | 201910552537.1 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110263021B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 崔天雨;宋设;单震 | 申请(专利权)人: | 浪潮卓数大数据产业发展有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/22;G06F16/245;G06F16/28 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜明 |
地址: | 214029 江苏省无锡市滨*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 个性化 标签 体系 主题 生成 方法 | ||
本发明特别涉及一种基于个性化标签体系的主题库生成方法。该基于个性化标签体系的主题库生成方法,以大数据平台为支撑,将大数据进行归类,一方面利用标签从多个维度对数据进行标识,依据标签项提取数据,对数据抽象出实体并打标签,对零散但有逻辑的数据实现统一管理;同时通过建立标签的方式建立主题库,将数据汇聚在各主题下,用户根据需求通过主题库即可快速拿到相关的主题下的数据。该基于个性化标签体系的主题库生成方法,对于拥有庞大数据量的机构或企业能够显著提高数据提取效率,适宜推广应用到各行各业。
技术领域
本发明涉及大数据管理技术领域,特别涉及一种基于个性化标签体系的主题库生成方法。
背景技术
互联网数据的爆炸增长,使得众多机构组织需要维护的数据量不断增大,传统的手工写sql筛选查找数据库数据的方式越来越乏力,落后的数据管理无法适应当前的大数据量,众多数据在数据库中得不到有效利用,抽取相关数据费时费力,目前存在的应用处理程序,大都需要自己整理好初始数据后才可以运行。若能在数据处理之前就对数据进行主题库归类,则能大大减少数据处理程序需要的数据准备时间。
同时,标签的应用也愈加广泛,现实中的数据常常过于复杂,就用户为例,我们在面对具体场景时关心的常常是用户的某一个维度特征,而不是所有数据,针对特定维度建立标签使得数据更加直观,关注点更加清晰。
华东师范大学李明丽等于2009年发表的《主题资源生成式建设研究》中,分析了国内外的教育资源库建设的现状,提出了资源的主题化和生成式的建设思路;研究设计出一个具有生成式功能的主题资源库。面向的用户为教师和学生两个用户群,针对不同用户群分别建设不同的资源素材。
然而,由于互联网时代大数据的爆炸增长使得对数据的索引和价值提取难度增大,对各类资源的主题库建设可以将资源有效的划分,从而有针对性的拿取数据,避免了不相关资源的干扰,提高资源的有效利用率。此文中虽然提供了建立主题库的思想,但是对主题库的生成方式受时代的影响无法对大数据量的场景做研究,面对如今如此庞大的数据,手工处理的方式受到了应用场景限制。应时代发展要求,我们需要找到批量,灵活的主题库生成方式。
由于数据的复杂与多元性,标签更能直白的体现个体的特征,结合大数据平台与众多算法库,生成标签也变得更加容易,针对所有可抽象出的实体均可以建立标签。进而,将标签和主题库相关联,可通过标签实现主题库的创建。
基于上述情况,本发明设计了一种基于个性化标签体系的主题库生成方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的基于个性化标签体系的主题库生成方法。
本发明是通过如下技术方案实现的:
一种基于个性化标签体系的主题库生成方法,其特征在于:以大数据平台为支撑,将大数据进行归类,一方面利用标签从多个维度对数据进行标识,依据标签项提取数据,对数据抽象出实体并打标签,对零散但有逻辑的数据实现统一管理;同时通过建立标签的方式建立主题库,将数据汇聚在各主题下,用户根据需求通过主题库即可快速拿到相关的主题下的数据。
该基于个性化标签体系的主题库生成方法,包括以下步骤:
(1)生成标签池
包括创建实体,创建标签项,创建个性化规则和生成标签池四个部分;
(2)生成主题库
包括实现标签池搜索功能,查找主题相关标签项,对各标签项进行数据查询和导出数据生成主题库四个部分。
所述步骤(1)中,生成标签池具体步骤如下:
(a)根据数据库中数据之间的逻辑关系创建实体,并以数据库相关表中一个或多个字段作为数据的唯一标识将数据划分为多个个体;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910552537.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:在线学习测验题库管理系统及管理方法
- 下一篇:酒店数据匹配方法及装置