[发明专利]一种用于影视素材领域的非结构化数据管理方法有效
申请号: | 201610972138.7 | 申请日: | 2016-11-04 |
公开(公告)号: | CN108021592B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 毛顺亿;高洪皓;朱永华;刘宁杰;高迅;张铁男 | 申请(专利权)人: | 上海大学 |
主分类号: | G06F16/182 | 分类号: | G06F16/182;G06F16/11;G06F16/43 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 叶敏华 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 影视 素材 领域 结构 数据管理 方法 | ||
本发明涉及一种用于影视素材领域的非结构化数据管理方法,用于对影视素材领域的非结构化数据进行分布式存储、查询和可视化管理,分布式存储具体为:建立影视素材领域的知识本体,包括领域知识库KS和标签分类库LS;确定非结构化数据的存储路径,按照存储路径将其存储到HDFS文件系统中,同时将影视素材的非结构化数据的描述信息存储到数据库中;查询和可视化管理具体为:通过计算语义相似相关度拓展用户的搜索条件;根据拓展后的搜索条件,利用ElasticSearch搜索引擎结合Jena推理算法进行搜索,得到搜索结果并反馈给用户;利用可视化工具对搜索数据进行展示。与现有技术相比,本发明具有适用于非结构化数据、搜索条件可扩展、查询灵活以及可视化展示等优点。
技术领域
本发明非结构化数据管理领域,尤其是涉及一种用于影视素材领域的非结构化数据管理方法。
背景技术
影视素材在影视后期制作、教学、研究等多领域被大量应用。能用统一结构表示的数据称为结构化数据;字段长度可变,没有预定义数据模型的数据称为非结构化数据。传统的关系型数据库可以较好管理结构化数据,但在异构数据海量膨胀的背景下,关系型数据库暴露出明显局限性。
影视素材中文本、图像、音频、视频等都属于非结构化数据。相比较结构化数据,其存在存储管理、查询处理和查询优化等问题。因而,在海量的影视素材中,如何有效存储并且查询非结构化的影视数据,是媒资管理中亟需解决的问题。
发明内容
本发明的目的是针对上述问题提供一种用于影视素材领域的非结构化数据管理方法。
本发明的目的可以通过以下技术方案来实现:
一种用于影视素材领域的非结构化数据管理方法,用于对影视素材领域的非结构化数据进行分布式存储、查询和可视化管理,所述分布式存储具体为:
A1)建立影视素材领域的知识本体,包括领域知识库KS和标签分类库LS;
A2)根据建立的影视素材领域的知识本体,确定所接收影视素材的非结构化数据的存储路径,按照存储路径将其存储到HDFS文件系统中,同时将影视素材的非结构化数据的描述信息存储到数据库中;
所述查询和可视化管理具体为:
B1)通过计算语义相似相关度拓展用户的搜索条件;
B2)根据拓展后的用户的搜索条件,利用ElasticSearch搜索引擎结合Jena推理算法进行搜索,得到搜索结果并反馈给用户;
B3)利用可视化工具对搜索数据进行展示。
所述步骤A1)具体为:
A11)对影视素材领域的知识进行分类,得到领域知识库KS;
A12)根据步骤A11)的分类结果建立影视素材领域的知识本体,所述影视素材领域的知识本体为树结构,所述树结构上的结点对应影视素材领域的知识分类;
A13)对步骤A12)中树结构上的结点进行信息描述并设置语义标签,得到标签分类库LS。
所述步骤A2)具体为:
A21)根据领域知识库KS确定接收的影视素材的非结构化数据的相关分类;
A22)根据标签分类库LS确定接收的影视素材的非结构化数据的语义标签;
A23)根据确定的相关分类和语义标签确定影视素材的非结构化数据的存储路径;
A24)按照存储路径将影视素材的非结构化数据存储至HDFS文件系统的主控机器中,主控机器将其分配到其他从属机器进行存储,从属机器同时对影视素材的非结构化数据进行备份;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610972138.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:带尖齿的装载机铲斗
- 下一篇:一种视频调度的方法及系统