[发明专利]一种内容信息处理方法和系统有效
申请号: | 201380079592.4 | 申请日: | 2013-10-08 |
公开(公告)号: | CN105531697B | 公开(公告)日: | 2018-12-14 |
发明(设计)人: | 施有铸;陈晓峰 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 内容 信息处理 方法 系统 | ||
本发明公开了一种内容信息处理方法及系统。其中,方法包括:捕获内容并在内容索引数据库中创建该内容的内容索引,该内容索引是内容的唯一标识;提取内容索引对应的第一信息,第一信息包括:内容的元数据,以及除内容的元数据之外的内容的其他相关信息;对内容的各个元数据分别与预设的数据量大小阈值进行比较,将内容索引以及不高于所述阈值的内容的元数据存储到内容索引数据库,将高于阈值的内容的元数据以及除内容的元数据之外的内容的其他相关信息以及内容索引存储到内容信息数据库中。这样就解决了海量内容的存储和管理的难题,有效地提升内容管理系统对含有大数据量内容信息的管理能力。
技术领域
本发明涉及数据库技术领域,尤其涉及一种内容信息处理方法和系统。
背景技术
企业内容管理(ECM,Enterprise Content Management)技术是一种通过计算机系统对内容(Content)进行管理的技术,在企事业单位、政府机关中被广泛使用,有时被简称为内容管理(Content Management)。企业内容管理被用来对内容进行创建(Create)、存储(Store)、分发(Distribute)、发现(Discover)、归档(Archive)以及管理(Manage),并在用户需要时传递(Deliver)相关内容给用户。
内容所包含的数据种类一般可分为两种,一种是可以用相同的层次结构来表示的数据,即结构化数据,通常以数据表的形式存放在数据库之中;另外一种就是以各种形式的多媒体内容存在,如txt文本、word文本、pdf文本存在的文本类内容,电子表格、简报档案与电子邮件等二进制文件,声音、图形、图像、视频等多媒体格式数据等。
在数据库领域,元数据(Metadata)指的是描述数据及其环境的一类数据信息。相应的,在ECM系统中,内容元数据(Content Metadata)指的是对内容的属性及其环境进行描述的数据,包括但不限于:内容的名称、内容的大小、内容的存储格式、内容的标题、内容的摘要、内容中的关键词以及内容的作者等。
除内容元数据之外,还有其他的内容信息需要被管理,包括但不限于:用户对内容的评论信息,文档的正文信息、内容所属的专题分类信息,以及目录信息等。
传统的ECM系统一般通过关系数据库(RDB,Relational DataBase)作为内容元数据的存储系统,而这仅仅适用于ECM系统管理的内容数目较少的情况下。当ECM系统所管理的内容数目很多时(譬如:上亿条),因RDB受限于其存储容量,就难以存储如此海量的内容元数据,特别当单个内容元数据的信息很大时,对该内容元数据的增加(Add)、删除(Delete)、修改(Modify)、查询(Search)等操作就变得非常缓慢,效率低下。如果将用户评论、文档正文等类型的内容信息也存储在RDB中,使用关系数据库的ECM系统所能管理的内容的数目就更少。
发明内容
鉴于此,本发明的实施例提供一种内容信息的处理方法和系统,能够有效地提升内容管理系统对含有大数据量内容信息的管理能力。
一方面,提供了一种内容信息处理系统,包括:
内容索引创建模块,用于捕获内容并在内容索引数据库中创建针对上述内容的内容索引,该内容索引是所述内容在所述内容信息处理系统的唯一标识;
内容信息提取模块,用于提取上述内容索引对应的内容的第一信息,其中,该内容的第一信息包括:内容的元数据,以及除内容的元数据之外的内容的其他相关信息;
内容信息存储处理模块,用于对内容的第一信息中的内容的各个元数据分别与预设的数据量大小的阈值进行此较,将内容索引以及不高于阈值的内容的元数据存储到内容索引数据库中,将高于阈值的内容的元数据以及内容的第一信息中除内容的元数据之外的内容的其他相关信息以及内容索引存储到内容信息数据库中。
可选的,上述内容信息处理系统还包括:阈值设定模块,用于设定对内容的元数据进行此较的数据量大小的阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380079592.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于使用通信历史信息形成群组的方法和设备
- 下一篇:定向窥探介入
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法