[发明专利]一种用于影视素材领域的非结构化数据管理方法有效
申请号: | 201610972138.7 | 申请日: | 2016-11-04 |
公开(公告)号: | CN108021592B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 毛顺亿;高洪皓;朱永华;刘宁杰;高迅;张铁男 | 申请(专利权)人: | 上海大学 |
主分类号: | G06F16/182 | 分类号: | G06F16/182;G06F16/11;G06F16/43 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 叶敏华 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 影视 素材 领域 结构 数据管理 方法 | ||
1.一种用于影视素材领域的非结构化数据管理方法,用于对影视素材领域的非结构化数据进行分布式存储、查询和可视化管理,其特征在于,所述分布式存储具体为:
A1)建立影视素材领域的知识本体,包括领域知识库KS和标签分类库LS,所述影视素材领域的知识本体为树结构,所述树结构上的结点对应影视素材领域的知识分类;
A2)根据建立的影视素材领域的知识本体,确定所接收影视素材的非结构化数据的存储路径,按照存储路径将其存储到HDFS文件系统中,同时将影视素材的非结构化数据的描述信息存储到数据库中;
所述查询和可视化管理具体为:
B1)通过计算语义相似相关度拓展用户的搜索条件;
B2)根据拓展后的用户的搜索条件,利用ElasticSearch搜索引擎结合Jena推理算法进行搜索,得到搜索结果并反馈给用户;
B3)利用可视化工具对搜索数据进行展示;
步骤B1)具体为:
B11)对用户的搜索条件进行自然语言处理;
B12)计算处理后的搜索条件的语义相似相关度,所述语义相似相关度包括字面相似度wordSim(A,B)、语义重合度semCR(A,B)、距离相似度disSim(A,B)和层次深度depH(A,B);
B13)根据计算结果得到拓展后的搜索条件;
所述字面相似度wordSim(A,B)具体为:
所述语义重合度semCR(A,B)具体为:
所述距离相似度disSim(A,B)具体为:
所述层次深度depH(A,B)具体为:
其中,A和B表示影视素材领域的知识本体的两个结点,R表示根节点,wordNum表示汉字数,nodeSet表示结点集合,length表示途经长度;
步骤B2)具体为:
B21)利用ElasticSearch搜索引擎,将拓展后的用户的搜索条件与标签分类库LS进行匹配;
B22)根据标签分类库LS的匹配结果得到对应的领域知识库KS中的结点,利用Jena推理算法得到其兄弟结点;
B23)将步骤B22)中得到的结点及其兄弟结点对应的描述信息和影视素材的非结构化数据作为搜索结果;
B24)对步骤B23)得到的搜索结果进行排序并反馈给用户。
2.根据权利要求1所述的用于影视素材领域的非结构化数据管理方法,其特征在于,步骤A1)具体为:
A11)对影视素材领域的知识进行分类,得到领域知识库KS;
A12)根据步骤A11)的分类结果建立影视素材领域的知识本体,所述影视素材领域的知识本体为树结构,所述树结构上的结点对应影视素材领域的知识分类;
A13)对步骤A12)中树结构上的结点进行信息描述并设置语义标签,得到标签分类库LS。
3.根据权利要求1所述的用于影视素材领域的非结构化数据管理方法,其特征在于,步骤A2)具体为:
A21)根据领域知识库KS确定接收的影视素材的非结构化数据的相关分类;
A22)根据标签分类库LS确定接收的影视素材的非结构化数据的语义标签;
A23)根据确定的相关分类和语义标签确定影视素材的非结构化数据的存储路径;
A24)按照存储路径将影视素材的非结构化数据存储至HDFS文件系统的主控机器中,主控机器将其分配到其他从属机器进行存储,从属机器同时对影视素材的非结构化数据进行备份;
A25)影视素材的非结构化数据的描述信息存储到数据库中,所述描述信息包括本体结构信息、相关分类、语义标签和存储路径。
4.根据权利要求1所述的用于影视素材领域的非结构化数据管理方法,其特征在于,所述自然语言处理包括中文分词和过滤预定义的停用词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610972138.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:带尖齿的装载机铲斗
- 下一篇:一种视频调度的方法及系统