[发明专利]一种非结构化数据标注管理方法及系统在审

专利信息
申请号: 201811208798.3 申请日: 2018-10-17
公开(公告)号: CN109408688A 公开(公告)日: 2019-03-01
发明(设计)人: 邓炽成 申请(专利权)人: 珠海市智图数研信息技术有限公司
主分类号: G06F16/906 分类号: G06F16/906
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 卢泽明
地址: 519000 广东省珠海市横琴新*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种非结构化数据标注管理方法及系统,包括标签管理平台,所述标签管理平台包括特征抽取模块、存储管理模块、转换加载模块、数据标签模块、访问接口模块和查询处理模块,所述标签管理平台连接端设有业务抽象模块和人工处理模块;所述数据标签模块包括标签创建模块、标签标记模块和标签存储模块;所述特征抽取模块包括文本抽取模块、图像抽取模块、音频抽取模块和视频抽取模块;所述文本抽取模块用于从文本中抽取停用词、TF‑IDF特征和关键词。本发明通过建设标签管理平台,利用数据标签模块实现描述业务属性的数据标签创建、转换、存储的“一站式”管理,提高大数据利用价值,提高垂直业务数据智能分析水平。
搜索关键词: 标签管理 数据标签 管理方法及系统 非结构化数据 特征抽取模块 抽取模块 文本抽取 标注 查询处理模块 存储管理模块 访问接口模块 图像抽取模块 标签标记 标签创建 标签存储 抽象模块 加载模块 模块实现 人工处理 业务属性 业务数据 智能分析 大数据 连接端 停用词 一站式 转换 抽取 垂直 存储 视频 文本 创建 管理 建设
【主权项】:
1.一种非结构化数据标注管理系统,包括标签管理平台(1),其特征在于:所述标签管理平台(1)包括特征抽取模块(2)、存储管理模块(3)、转换加载模块(4)、数据标签模块(5)、访问接口模块(6)和查询处理模块(7),所述标签管理平台(1)连接端设有业务抽象模块(8)和人工处理模块(9);所述数据标签模块(5)包括标签创建模块、标签标记模块和标签存储模块;所述特征抽取模块(2)包括文本抽取模块;所述文本抽取模块用于从文本中抽取停用词、TF‑IDF特征和关键词;所述存储管理模块(3)提供存储建模功能,可插入、修改和删除非结构化数据;所述转换加载模块(4)用于根据提取的特征对常用格式的文本、图像、音频和视频数据进行自动化处理;所述访问接口模块(6)用于应对查询语言、应用程序和Web服务访问的接口要求;所述查询处理模块(7)用于提供查询结果排序和批量返回功能,并进行范围查询、全文查询、样例查询、和语义查询,利用多种查询方式对管理系统中的非结构化数据进行查询;所述业务抽象模块(8)将业务非结构化数据抽象,制定符合业务要求的数据标准;所述人工处理模块(9)具体为用户终端,利用人工,根据非结构化数据处理的要求对数据进行人工处理,调整数据,使其符合业务要求的数据标准;所述标签创建模块、标签转换模块和标签存储模块用于实现描述业务属性的数据标签创建、转换、存储的“一站式”管理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海市智图数研信息技术有限公司,未经珠海市智图数研信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811208798.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top