[发明专利]基于BERT的影视作品地域知识图谱构建方法及系统在审
申请号: | 202110853213.9 | 申请日: | 2021-07-27 |
公开(公告)号: | CN113609305A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 杨艳妮;闵锦涛;林丽萍;周蕾 | 申请(专利权)人: | 三峡大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/9537;G06F40/284 |
代理公司: | 宜昌市三峡专利事务所 42103 | 代理人: | 成钢 |
地址: | 443002 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 bert 影视作品 地域 知识 图谱 构建 方法 系统 | ||
本发明涉及基于BERT的影视作品地域知识图谱构建方法,包括:采集影视作品文本数据,构建地域领域词典,对文本数据进行预处理和分词,得到影视作品的地域关联数据;对地域关联数据中的实体进行定义,建立实体之间的关联关系;对影视作品的地域关联数据中的实体和实体关系进行标注;对BERT模型进行训练;利用BERT模型对未标注的影视作品抽取得到影视作品的实体关系;将得到的影视作品的实体关系存入图数据库,得到影视作品的地域特色知识图谱。本发明还公开了相应的知识图谱构建系统。本发明实现了地域特色知识图谱的自动构建,构建得到的影视作品地域特色知识图谱有利于文化宣传人员、研究人员建立影视作品地域特点的直观印象,分析影视作品的地域差异。
技术领域
本发明属于文本智能识别领域,具体涉及一种基于BERT的影视作品地域知识图谱构建方法及系统。
背景技术
知识图谱由Google公司在2012年首先提出,最早主要应用于搜索引擎,以准确地阐述人、事、物之间的关系。知识图谱包括实体、关系、属性三个主要要素。知识图谱的构建首先确定知识表示模型,然后根据不同的知识来源选择不同的知识获取手段并导入相关知识,接着基于知识推理、知识融合等技术构建相应的知识图谱,最后依据不同应用场景设计知识图谱的表现方式。知识图谱作为基于图结构的知识存储管理模式,具有关系清晰、结构灵活等特点,除了可以应用于知识可视化和知识问答,还具有一定的语义推理能力,辅助决策者进行关联知识的检索和利用。
互联网平台具有海量的影视作品相关文本信息,对影视行业研究具有重要价值。影视作品中展现的地域特色代表了地域形象,是地域文化宣传推广非常重要的渠道。但由于信息分布分散且质量良莠不齐,用户在获取影视作品的地域特色相关信息时需要进行人工筛选,耗时长、效率较低且准确性不高。因此需对地域关联知识进行挖掘和分析,通过构建相应的知识图谱,提高影视作品关联的地域特色数据利用效率,从而有效提取影视作品的地域特色信息,以及便捷获取某一地域的关联影视作品信息。
相较于通用知识图谱,领域知识图谱构建需更为精准。目前国内针对医疗、电力、金融、教育等大领域的知识图谱构建研究较丰富,但对于如影视作品等精细领域的知识图谱构建相对缺乏。
而影视作品的地域特色知识图谱构建通过对大量影视作品的关联的地域数据进行结构化分析,能够为我国地方影视研究和影视行业实践提供更精准的决策信息咨询服务,其成果能较好地服务于国家及地方文化软实力提升。
发明内容
本发明的目的是针对上述问题,提供一种基于BERT的影视作品地域知识图谱构建方法,利用标注的地域关联数据的实体和实体关系对深度学习模型进行训练后,将未标注的影视作品的地域关联数据输入深度学习模型,利用深度学习模型抽取得到影视作品的实体关系,将得到实体关系存入图数据库,得到影视作品的地域特色知识图谱;影视作品地域知识图谱构建系统利用训练好的深度学习模型从未标注的影视作品的地域关联数据中抽取得到实体关系,将实体关系存入图数据库,得到影视作品的地域特色知识图谱并向系统用户展示。
本发明的技术方案是基于BERT的影视作品地域知识图谱构建方法,包括以下步骤:
步骤1:采集影视作品文本数据,构建影视作品地域领域词典,并对文本数据进行预处理和分词,得到影视作品的地域关联数据;
步骤2:对地域关联数据中的实体进行定义,建立实体之间的关联关系;
步骤3:依据实体与实体关系,对影视作品的地域关联数据中的实体和实体关系进行标注,得到标注后的实体和实体关系;
步骤4:利用影视作品的地域关联数据以及标注的实体和实体关系,对BERT模型进行训练;步骤5:将未标注的影视作品的地域关联数据输入BERT模型,利用BERT模型抽取得到影视作品的实体关系;
步骤6:将得到的影视作品的实体关系存入图数据库,得到影视作品的地域特色知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三峡大学,未经三峡大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110853213.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:竹片打包装置
- 下一篇:防糊边的激光切割方法