[发明专利]基于本体的数字出版物语义标注优化方法有效
申请号: | 201510156576.1 | 申请日: | 2015-04-03 |
公开(公告)号: | CN104750836B | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 刘永坚;白立华;杨朝阳;曾瑞;李文忠;杨慧 | 申请(专利权)人: | 武汉理工大学;时代出版传媒股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 张惠玲 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于本体的数字出版物语义标注优化方法。包括如下步骤:文档内容预处理;构建本体模型;构建个体并填充数据属性值;调整文档标注及标注权值;存储标注及标注权值;输入词语进行知识查询,匹配数据并按权值排序。本发明方法能够提高文档标注的准确性,用户使用本体知识库进行知识查询时能更快速的搜索到有效的文档,并能提高其他相关联电子文档标注的准确性。 | ||
搜索关键词: | 基于 本体 数字 出版物 语义 标注 优化 方法 | ||
【主权项】:
1.基于本体的数字出版物语义标注优化方法,其特征在于,包括如下步骤:文档内容预处理:在计算机系统中对文档进行解析,利用关键字提取工具提取关键字,并基于词语位置计算出关键字的权值,为后续构建个体提供数据基础;构建本体模型:在计算机系统中通过本体构建工具构建本体,采用自顶向下的方法原则,在工具中完成类、对象属性、数据属性的构建,构成包括了类、对象属性和数据属性的本体;构建个体并填充数据属性值:个体是根据本体中已有的类建立的实例,构建个体是用户根据文档内容对文档进行模型化的过程,并填充个体数据属性,从文档标注中获取数据属性的值;调整文档标注及标注权值:获取文档原有的标注信息以及上述个体填充的属性值和属性值对应的文档,对文档中的标注进行调整,将个体所在类的级别以及数据属性的优先级作为权值因子加入到权值计算公式中,获取属性值的权值并作为文档的新标注;存储标注及标注权值:删除文档对应的原有标注,将上述中调整后的标注和权值存储到标注对应的数据表中;当其他文档进行内容标注时,标注表中的数据作为影响因子加入到标注的权值计算公式中;输入词语进行知识查询,匹配数据并按权值排序:用户通过知识查询进行查询,当根据数据属性信息匹配个体,在显示该个体的所有信息时会根据查找属性值在文档中的权值进行排序,显示结果会按照权值的降序排列查询结果;所述的构建个体并填充数据属性值中,在每个数据属性对应一个文本框,用来输入和显示该数据属性信息;数据属性的值是从文档标注中获取的,通过标注无法获取的属性值就会根据全文检索获取关键信息作为数据属性值;所述的调整文档标注及标注权值中,如果属性值是文档原有标注,则原有权值和现有权值合并,然后将新旧标注按照权值排序,选择权值高的作为文档的标注。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学;时代出版传媒股份有限公司,未经武汉理工大学;时代出版传媒股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510156576.1/,转载请声明来源钻瓜专利网。