[发明专利]一种东巴文释读数据库建立方法有效

专利信息
申请号: 201510303392.3 申请日: 2015-06-04
公开(公告)号: CN104866607B 公开(公告)日: 2018-01-12
发明(设计)人: 徐小力;王红军;吴国新;王宁;李志华 申请(专利权)人: 北京信息科技大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京远大卓悦知识产权代理事务所(普通合伙)11369 代理人: 贺持缓
地址: 100192 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 东巴文 释读 数据库 建立 方法
【说明书】:

技术领域

发明涉及一种文字释读数据库建立方法,特别是关于一种东巴文释读数据库建立方法。

背景技术

纳西族东巴象形文被国际学界认为是当今世界上唯一还在使用的象形文字,至今仍在被在世的东巴祭司使用,用其主持各种仪式,写信、记账等。东巴经典的核心是崇尚自然,追求人与自然和谐统一,多元文化和谐共处。东巴经典内容涉及哲学、历史、宗教、医学、天文、地理、民俗、动植物、军事、文学和艺术等领域,堪称纳西族古代社会的百科全书。

东巴文字字少意繁,文字的形、音、义都极其复杂,往往一字多形、多音、多义,也有异形同义的。书写系统与一字一个音节不同,无法单从语音角度识别,其基本表达单位不局限于语素一级,有时包括音节、句子,还需要借助记忆。自古以来,东巴经典文化的传承自古以来都是以东巴家族内部口传心授的形式进行的,目前还能释读东巴象形文字的人只是几位年逾古稀的老东巴祭司。

该象形文字具有独特的图形、发音及释读方式,东巴象形文字释读的图形数字化、语音数字化及内容数字化具有明显的复杂性、不确定性,以及东巴象形文在图形识别、语音辨识、内容释读以及形、音、义信息及其共轨信息等方面,现有的英文、汉字等识别系统及翻译系统不能适用。我国研究人员及后继人才稀少,保存机构分散,保管条件恶劣,编研工作受限,抢救手段落后,缺乏经费支持,抢救及保护已迫不容缓。

发明内容

针对上述问题,本发明的目的是提供一种东巴文释读数据库建立方法,其有效解决了东巴象形文字释读数字化的难题。

为实现上述目的,本发明采取以下技术方案:一种东巴文释读数据库建立方法,其特征在于,所述建立方法包括以下步骤:1)对现有东巴文化资料进行采集并建立图形模板库、音频模板库和视频模板库;2)根据图形模板库、音频模板库和视频模板库建立释读数据库,释读数据库包括词意数据库、句意数据库和事件数据库;词意数据库:提取现有东巴经典中的东巴象形文字作为标准字模,采用Unicode对每个字符进行编码,并利用TrueType方法建立东巴象形文标准模板库;将东巴象形文标准模板库中的文字已有释读资料进行整理录入;句意数据库包括句意编码、东巴语句、对应汉语、语句含义、分类、图形代码、音频代码和视频代码;事件数据库包括事件名称代码、事件名称、分类、事件内容、图形代码、音频代码和视频代码;其中内容分类包括:哲学、历史、宗教、医学、天文、地理、民俗、动植物、军事、文学和艺术;3)将词意数据库、句意数据库、事件数据库进行融合,融合后与释读知识库连接,释读知识库根据规则对三种释读数据库进行释读内容的组合,并利用推理引擎促进释读知识库与三种释读数据库的融合,完成释读数据库的建立。

所述步骤1)中,所述图形模板库是将通过数码照相机和扫描仪采集的东巴经典古籍资料图片进行图像处理,保存为JPG格式文件;所述图形模板库内包括唯一图形代码、标准字形、异形字;其中所述图形模板库中的图形内容有东巴文字、东巴语句和东巴事件。

所述步骤1)中,所述音频模板库是采用音频编辑软件对通过录音设备获取的高采样频率音频资源进行剪辑,保存为mp3格式文件,高采样频率为320kb/s;所述音频模版库内包括唯一音频代码、音频存储路径和纳西音标;其中音频模板库中的音频内容包括东巴文字、东巴语句和东巴事件。

所述步骤1)中,所述视频模板库是将采集到的东巴经典古籍资料的视频资源进行剪辑,加载解说音频、解说字幕或配乐,保存为wmv格式文件;所述视频模版库内包括唯一视频代码和视频存储路径;其中所述视频模板库中的视频内容也包括东巴文字、东巴语句和东巴事件。

所述步骤2)中,所述词意数据库的字段包括词意编码、图形代码、对应汉字、分类、对应英文、翻译员、中文释义、音频代码、纳西音标和视频代码。

所述步骤3)中,所述规则如下:定义S为规则集,C={C1、C2...Cn}为条件属性集,V=(Vc1,Vc2...Vcn)是条件属性和决策属性的值域,D是决策属性集,(d1,d2,d3...dv)为决策值;规则为:如果输入条件属性C1为值域V中的某一值Vc1,那么决策属性D为对应的决策值d1,即输出满足Vc1时相应字段对应的属性;如果输入两个条件属性C2、C3,其中C2为值域V中的某一值Vc2,C3为值域V中的某一值Vc3,那么决策属性D为决策值d2,即输出满足Vc2、Vc3时相应字段对应的属性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510303392.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top