[发明专利]基于OWL的互联网语言本体学习系统无效

专利信息
申请号: 201110270784.6 申请日: 2011-09-14
公开(公告)号: CN102332013A 公开(公告)日: 2012-01-25
发明(设计)人: 王楠 申请(专利权)人: 王楠
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 南京纵横知识产权代理有限公司 32224 代理人: 董建林
地址: 210006 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 owl 互联网 语言 本体 学习 系统
【说明书】:

技术领域

发明属于计算机技术领域,具体涉及一种学习型的互联网本体语言转换系统。

背景技术

今天,互联网已经深入人类社会的每个角落,而且可以预见其将在人类文明发展进程中扮演越来越重要的角色。让计算机“读懂”互联网,使得互联网更加智能化是人类的梦想。目前,计算机对互联网信息的处理方式大致可以分为如下几类:

1)对互联网信息内容和格式不做分析,即:把互联网信息作为信息流(字节)进行接收、存储、查询、发送等等。在这种情况下,互联网信息主要是一些数据,包括数字、字符串、媒体流等;计算机按照软件工程师设计好的流程执行,每一步都在一个预先设计好的已知状态集中匹对和判断当前状态,并决定下一步的执行策略。所有的执行策略都是软件工程师设计好,并事先输入给计算机的。

2)对互联网信息内容做关键词匹对分析,这时计算机对互联网文本的“理解”就是:该文本可能包含一些用户指定的关键词。计算机并不真懂文章内容,只是在代码级别上的比较,而把所有的理解任务交给人来处理。仅仅在这个水平上,就产生了巨大的搜索引擎产业,并造就了Google、百度等行业巨头。

3)对互联网信息内容和格式做简单的语义识别。目前,主要采用RDF协议对词与词之间的语义做简单的定义和解析。对于计算机来说,所有的词仍然只是字符串,计算机并不知道其语义,但知道某些字符串与另外一些字符串有绑定(即:结构)关系,由此可以根据这些绑定关系做简单的推理。而对于内容的理解工作,仍然是由使用计算机的人完成的。

4)试图用知识结构重新构造互联网,即:语义互联网,主要采用W3C的互联网本体语言(Ontology of Web Language,简称:OWL)建立语义网络。如果所有人都按OWL创建互联网,互联网本身就成为一个计算机可以在一定程度上“理解”的知识结构。软件工程师们将为计算机设计一系列推理规则和引擎,在OWL语义网络上让计算机自己“理解”互联网信息内容,并做出正确的判断和操作。

OWL的构思代表了未来的发展方向。这是人类对赋予计算机互联网知识结构,并为创造一个计算机能够读“懂”互联网信息内容的非常重要的尝试。但是,如果采用传统的编程方法来实现这一设想,即:构建完整的OWL知识结构;进而建立完善的推理规则;然后,在此推理规则基础上构造一个强大的推理引擎,让计算机按照软件工程师预先构造的所有中间状态去做出推理过程中的每一步判断,从而读“懂”互联网信息内容。首先,这需要极高的智慧和技术技巧,再聪明的工程师也无法想象整个互联网知识的复杂性;所以,让所有的普通网站建设者按此方式构造OWL语义互联网几乎不可能;即便个别网站工程师可以做到,也很难达到大规模应用的水平,更谈不上催生一个产业。其次,目前互联网上的数据已经巨大到无法估量,想将其转换成OWL形式,这无疑是基本上不可能完成的任务。因此,OWL走向实用的关键不是将整个互联网都变成OWL语言描述的互联网,而是对现有互联网以HTML文本或XML文本为主的海量信息进行OWL分析、提取和转换。

 

发明内容

本发明提供了一种解决上述问题的方案,提供一种实用性强的基于OWL的互联网语言本体学习系统。

本发明采用如下的设计思路让计算机在一定程度上读得“懂”互联网信息内容:

第一,与OWL设计理念相同的是:二者都将给计算机一个以OWL为基础的知识结构,但是,本发明并不打算用OWL构造整个互联网,而是从普通互联网文本中提取OWL信息,即:将文本中隐含的本体信息转译为OWL形式。计算机利用自身基于OWL的知识结构与互联网OWL隐含的本体信息进行比较和推理,从而实现读“懂”互联网的目的。

第二,与传统编程方法不同的是,本发明并不打算一次性地给计算机输入知识结构、推理规则和推理引擎,而是采用机器学习的方式,包括与工程师反复互动,逐步自我完善,由简入繁,达到大规模应用的水平。

第三,基于OWL的互联网语言学习系统不仅可以通过学习维护、更新、完善计算机的互联网本体知识模型,而且可以维护、更新、完善使用这个OWL互联网本体知识库的推理规则和推理引擎,以便灵活地运用于各类互联网智能化应用中。

基于以上思路,本发明提供一种基于OWL的互联网语言本体学习系统,其特征在于:其包括:

网页采集子系统,负责采集互联网网页并将其转换成格式文本;

OWL本体转换子系统,负责对所述互联网网页进行OWL本体转换,建立OWL本体实例; 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王楠,未经王楠许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110270784.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top