[发明专利]异构信息知识挖掘与可视化分析系统及方法无效
申请号: | 201210025598.0 | 申请日: | 2012-02-07 |
公开(公告)号: | CN102609512A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 李春梅;李艾丹;薛中玉;郭秋梅;杨思维;张志朋;桑道静 | 申请(专利权)人: | 北京中机科海科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100048 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 知识 挖掘 可视化 分析 系统 方法 | ||
技术领域
本发明涉及异构信息检索领域,特别涉及一种基于领域本体(Domain ontology)和知识挖掘的智能检索与分析方法,以及包含该方法的可视化分析系统。
背景技术
信息检索技术作为获取信息的方法和手段,其出现是网络发展史上的里程碑,它为网络用户带来了极大的便利,提高了各类信息的利用率。Google、百度是这个领域的典型代表。用户只要输入检索词或检索语句,信息检索系统就会按照一定的排序规则、为用户快速地返回包含该检索词或检索语句的所有网页。
然而,现有的通用搜索引擎无法准确地理解和处理各类专业领域知识,经常检索不到、甚至返回大量无关信息。主要原因在于:一方面,采取关键字匹配方式理解用户检索语句。信息检索系统并不关注用户输入的专业领域词汇的概念和语义,只是将分词后的关键词与索引库中的索引词按照字面形式进行直接匹配。另一方面,按照检索相关度对结果进行排序处理,即按照检索词和索引词之间相同的字或词的多少进行排序。
为了提高信息检索效率,一些信息检索系统提出了“相关搜索”等改进技术,然而,这些技术仍没有脱离字面匹配的本质。在人工智能(AI)等领域,领域本体、知识挖掘的引入为相关问题的解决带来了契机。
“本体”(Ontology)最初是哲学领域的术语,是关于事物存在及其本质规律的学说。20世纪末,随着信息技术的发展,本体被引入人工智能、知识工程、图书情报等领域,用于构建大型集成的知识库系统,解决知识概念表示和知识组织体系方面的问题。在新的技术领域,本体被赋予更为具体的定义——共享概念模型的、明确的、形式化的规范说明。本体一般由概念(Concepts)、概念间关系(Relations)和规则(Rules)构成。
(1)本体的目标是捕获相关领域的知识,确定该领域共同认可的词汇,并明确定义这些词汇及词汇间的相互关系,提供对该领域知识的共同理解,并以规范化的形式在计算机中加以存储。
(2)规定了论域。领域本体以一个特定的领域为描述对象,提供该特定领域的概念定义和概念之间的关系、主要理论、基本原理,以及领域中发生的活动等。
(3)知识表示、共享和重用。共享知识体系的表示是“机器可处理”的语义,它以RDF为基础,以URI作为命名机制、以XML为语法,将不同的应用集成在一起,对Web上的数据进行抽象表示。本体通过这种通用框架的表示方式,允许跨越不同应用程序、企业和团体的边界进行数据的共享和重用。
(4)信息交流的语义基础。由本体所提供的领域内共同认可的知识体系包括术语集、关系集和规则集,会为不同主体提供一种共识,为不同背景和领域下的人、机器、软件系统等进行信息交流提供了可能。
正是由于以上的特点和优势,所以本体为语义理解、智能检索等提供了可能。本体在人工智能、知识工程、图书情报、搜索引擎、信息系统以及计算机辅助设计等众多领域都有广泛的应用空间,并取得了一定的成果。但是,目前真正投入使用的本体及相关科研成果还很少。
数据库技术的发展以及数据应用的普及使得数据库中存储的数据量急剧增加,在这些数据中蕴含着许多重要的信息和知识,可供人们利用。目前数据库系统所能做到的只是对数据库中的数据进行存取、查询和简单统计等操作,而不能获得数据属性的内在关系和隐含的信息。若采用传统的数据分析手段,如统计等也不能对这些数据进行有效的分析、处理,因此,我们希望能够对这些数据进行较高层次的处理和分析以得到关于数据总体特征和发展趋势的预测。知识挖掘技术的出现,在许多领域得到应用,显示出强大的生命力。
知识挖掘是信息处理新技术,又是涉及数据库技术、人工智能、统计学等多学科领域的边缘学科。所谓知识挖掘,就是按照某种既定目标,从大量的、不完全的、有噪声的、模糊的、随机的数据中抽取隐含在其中的、事先未知的但又具有潜在应用价值的信息和知识的过程。知识挖掘与传统分析工具不同的是知识挖掘使用的是基于发现的方法,运用模式匹配和其它算法,发现数据之间的重要联系,甚至利用已有的数据对未来的活动进行预测。知识挖掘的目标是将大量非结构化的多媒体信息融合成有序的、分层次的、易于理解的信息,并进一步转换成可用于预测与决策的知识。在信息检索中应用知识挖掘技术,可大大提高检全率和检准率,提高信息检索的效率和性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中机科海科技发展有限公司,未经北京中机科海科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210025598.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置