[发明专利]数据标签处理方法、装置、计算机设备及存储介质在审
申请号: | 201910755580.8 | 申请日: | 2019-08-15 |
公开(公告)号: | CN110659283A | 公开(公告)日: | 2020-01-07 |
发明(设计)人: | 章育涛 | 申请(专利权)人: | 中国平安财产保险股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/27 |
代理公司: | 44325 深圳众鼎专利商标代理事务所(普通合伙) | 代理人: | 阳开亮 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 原始数据 应用层 待处理数据 检索数据 数据请求 数据库 数据传输效率 原始数据存储 计算机设备 标签发送 存储介质 方案解决 数据标签 数据仓库 数据同步 预设数据 索引化 匹配 自动化 标签 仓库 发送 | ||
本发明公开了一种数据标签处理方法、装置、计算机设备及存储介质,所述方法包括:对预设数据仓库中的原始数据进行数据同步,将所述原始数据存储到本地数据库;若接收到应用层发送的数据请求任务,则从所述本地数据库中选取与所述数据请求任务匹配的原始数据,并将选取到的所述原始数据作为待处理数据;对所述待处理数据进行索引化处理,得到可检索数据标签;将所述可检索数据标签发送到所述应用层。本发明的技术方案解决数据仓库与应用层之间数据传输效率低下,自动化程度不足,无法满足时效的问题。
技术领域
本发明涉及信息处理领域,尤其涉及数据标签处理方法、装置、计算机设备及存储介质。
背景技术
在大数据时代,基于大数据的应用中经常用到数据标签。数据标签,是对数据的标注,用以反映该数据某方面的特征或属性。标签化后的数据可以更直观、简洁的反映大数据所代表的趋势。
目前的数据标签管理体系,通常分为标签生产和标签应用两部分。其中,标签生产主要是对原始数据进行特征提取,得到与原始数据相对应的数据标签;标签应用主要是实现对数据标签进行归类、分析、输出等应用功能。
在现实应用中,标签生产和标签应用往往分别由不同的系统实现,系统之间的软硬件架构可能完全不同,这给标签生产和标签应用之间的数据交互带来了极高的传输成本。
例如,标签生产部分的数据由数据仓库负责存储,如采用Hive库,而标签应用部分部署的应用层随着实际业务的不同而不同,不同的应用层需要的数据可能存在交叉的情况,加上标签生产部分与标签应用部分的存储系统完全不同,数据结构也不相同,因此,需要研发人员根据标签应用的具体需求,分别从数据仓库中获取数据并进行转化,使得数据传输和转换的成本高,效率低下,自动化程度低,无法满足实时需求。
发明内容
本发明实施例提供一种数据标签处理方法、装置、计算机设备及存储介质,以解决数据仓库与应用层之间数据传输效率低下,自动化程度不足,无法满足时效的问题。
一种数据标签处理方法,包括:
对预设数据仓库中的原始数据进行数据同步,将所述原始数据存储到本地数据库;
若接收到应用层发送的数据请求任务,则从所述本地数据库中选取与所述数据请求任务匹配的原始数据,并将选取到的所述原始数据作为待处理数据;
对所述待处理数据进行索引化处理,得到可检索数据标签;
将所述可检索数据标签发送到所述应用层。
一种数据标签处理装置,包括:
数据同步模块,用于对预设数据仓库中的原始数据进行数据同步,将所述原始数据存储到本地数据库;
数据提取模块,用于若接收到应用层发送的数据请求任务,则从所述本地数据库中选取与所述数据请求任务匹配的原始数据,并将选取到的所述原始数据作为待处理数据;
索引处理模块,用于对所述待处理数据进行索引化处理,得到可检索数据标签;
数据发送模块,用于将所述可检索数据标签发送到所述应用层。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述数据标签处理方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述数据标签处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安财产保险股份有限公司,未经中国平安财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910755580.8/2.html,转载请声明来源钻瓜专利网。