[发明专利]一种基于少数民族文化知识图谱的查询及可视化系统构建方法在审

专利信息
申请号: 201911236888.8 申请日: 2019-12-05
公开(公告)号: CN111143574A 公开(公告)日: 2020-05-12
发明(设计)人: 刘爽;杨辉;李佳宜 申请(专利权)人: 大连民族大学
主分类号: G06F16/36 分类号: G06F16/36;G06F16/34;G06F16/338;G06F16/951;G06F40/295;G06F40/30
代理公司: 大连智高专利事务所(特殊普通合伙) 21235 代理人: 马庆朝
地址: 116600 辽宁省*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 少数 民族文化 知识 图谱 查询 可视化 系统 构建 方法
【说明书】:

一种基于少数民族文化知识图谱的查询及可视化系统构建方法,属于自然语言处理、计算机信息处理技术领域。技术方案:通过网络爬虫获取民族相关信息,构建少数民族文化数据库,利用分词工具进行分词及用户自定义词典对收集到的数据进行分词和词性标注;对数据进行命名实体识别和关系提取,以构建领域知识图谱;将抽取的实体和关系进行链接,得到三元组;用数据库将得到的三元组进行存储;搭建民族文化知识图谱查询以及可视化系统。有益效果:本发明通过构建民族文化知识图谱、查询及可视化系统,将少数民族文化信息通过互联网进行广泛传播,通过这一套查询及可视化系统方便普通大众对少数民族文化节日风俗的了解,有利于保护我国少数民族文化遗产。

技术领域

本发明属于自然语言处理、计算机信息处理技术领域,尤其涉及一种基于少数民族文化知识图谱的查询及可视化系统构建方法。

背景技术

知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱已经成为互联网知识驱动的智能应用的基础设施。知识图谱与大数据和深度学习一起,成为推动互联网和人工智能发展的核心驱动力之一。

为了推动少数民族文化的发展与推广,需要构建少数民族文化知识图谱,但目前国外对英文知识图谱构建的方法并不能全部适用于中文知识图谱的构建,特别是关于少数民族文化的知识图谱构建也相对较少,因此构建少数民族文化知识图谱对整合少数民族节日,民族禁忌,民族风俗等将起到非常重要的作用。目前在国内没有成型的少数民族文化知识图谱,同时目前国内也无针对少数民族文化查询和可视化的一套系统,因此迫切需要构建少数民族文化知识以及可以进行少数民族文化查询及可视化的一套系统的方法。

发明内容

为了解决上述现有技术中存在的问题,本发明提出一种基于少数民族文化知识图谱查询及可视化系统构建方法,该方法解决现有技术所存在的缺少少数民族文化知识图谱的问题,可以满足大众进行查询关于少数民族文化的需求。

技术方案如下:

一种基于少数民族文化知识图谱的查询及可视化系统构建方法,步骤如下:

S1、通过网络爬虫获取民族相关信息,构建少数民族文化数据库,利用分词工具进行分词及用户自定义词典对收集到的少数民族文化数据库中的数据进行分词和词性标注,并去除标点符号和停用词;

S2、对分词和词性标注后的数据进行检测,若出现未正常进行分词的词,则进行人工分词操作,并把人工分词结果添加到用户自定义词库,重复步骤S1,直到无新词为止;

S3、对正确分词后的数据进行命名实体识别和关系提取,用以构建领域知识图谱;

S4、将抽取的实体和关系进行链接,得到三元组;

S5、使用数据库将得到的三元组进行存储;

S6、搭建民族文化知识图谱查询以及可视化系统。

进一步的,步骤S1中,爬取民族相关百度百科内容、民族相关微博动态、民族相关新闻报道的文本数据,采用Python编程,使用request、BeautifulSoup、urllib库以及正则表达式等来进行网络数据的获取。

进一步的,步骤S1和步骤S2中所述的分词工具为jieba中文分词工具。

进一步的,步骤S3中,实体抽取方法为BiLSTM-CNN-CRF。

进一步的,步骤S1具体步骤如下:

S1.1、采用NLP对网上爬取的网页文本数据进行分句和分词,让爬取数据中的句子以一个句子和唯一匹配的token进行保存;

S1.2、对得到的句子、单词和标签进行统计,形成句表、词汇表和标签表;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911236888.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top