[发明专利]训释系联系统可视化的方法、系统、装置及可读存储介质在审
申请号: | 202010365120.7 | 申请日: | 2020-04-30 |
公开(公告)号: | CN111611400A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 王立军;许晶晶;李驰名;夏天 | 申请(专利权)人: | 北京师范大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/34 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
地址: | 100875 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训释系 联系 可视化 方法 系统 装置 可读 存储 介质 | ||
本发明提供了训释系联系统可视化的方法、系统、装置及可读存储介质,所述方法通过现代计算机手段,利用当下最流行的图形数据库和知识图谱技术,将训释系联系联通过计算机来实现和展现,取代了传统的人工绘制手段;通过计算机的图形数据库技术和知识图谱,将错误率和遗漏率降到最低,同时将训释系联系联更好的展现;减少巨大的人力和精力投入;使得科研成果更好的公开,便于知识共享和方便其他学者学习。
【技术领域】
本发明属于传统文学在计算机领域的应用,具体涉及训释系联系统可视化的方法、系统、装置及可读存储介质。
【背景技术】
训释系联系联是传统语言文字学研究的一个重要方法就是关系系联,训释系联系联包括互训,直训,递训。此方法在中国文字学研究史上一直存在使用,原来都是通过人工制作卡片再通过人工排比的方式来进行学习和研究。使用不同的古籍需要制作很多重复的卡片,工作量大,工作繁琐,浪费了很多时间和人力。不同的科研工作者在做同样的基础工作的时候也会制作同样的卡片,重复同样的事情,也造成了很多重复性劳动。在人工处理的过程中,疏漏之处在所难免。由于都是人工处理和制作卡片。造成了传统语言文字学研究的局限性,不能很好的服务于社会和其他学者。而原来的卡片排卡手段只能很有限的解释单个字的系联关系,而数据准确度和数据来源也有限。
在现有技术中,当下最流行的图形数据库和知识图谱技术,将训释系联系联通过计算机来实现和展现。其中,图形数据库是一种非关系型数据库,它应用图形理论存储实体之间的关系信息。最常见例子就是社会网络中人与人之间的关系。关系型数据库用于存储“关系型”数据的效果并不好,其查询复杂、缓慢、超出预期,而图形数据库的独特设计恰恰弥补了这个缺陷。知识图谱又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。而上述两种实现和展现方法,存在以下问题:(1)人工制作卡片,效率慢;(2)从事相应科研人员进行重复性劳动;(3)需要人力资源比较多;(4)数据资料不全;(5)遗漏率,错误率高。
因此,有必要研究训释系联系统可视化的方法、系统、装置及可读存储介质来应对现有技术的不足,以解决或减轻上述一个或多个问题。
【发明内容】
有鉴于此,本发明提供了训释系联系统可视化的方法、系统、装置及可读存储介质,通过现代计算机手段,利用当下最流行的图形数据库和知识图谱技术,将训释系联系联通过计算机来实现和展现。
一方面,本发明提供训释系联系统可视化的方法、系统、装置及可读存储介质,其特征在于,所述方法具体包括以下步骤:
S1:采集训诂类纸质书籍信息;
S2:将S1中纸质书籍信息进行校对;
S3:根据单字系联,多字系联和深度系联对书籍中的文本信息进行训释系联系联;
S4:通过对S3中的训释系联系联结果对汉字训释系联系统进行可视化展现。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S1具体包括:
S11:将训诂书籍数据进行电子化;
S12:将S11中的数据进行文本校对。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述S3具体包括:
S31:对校对完成的数据进行字段设计;
S32:将字段设计结果与校对完成的数据进行训释系联系联;
S33:对数据进行审核并进行入库数据处理;
S34:将S33中数据处理后的结果录入图形数据库;
S35:完成系联数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学,未经北京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010365120.7/2.html,转载请声明来源钻瓜专利网。