[发明专利]一种从互联网获取数据的方法和系统有效
申请号: | 201210126411.6 | 申请日: | 2012-04-26 |
公开(公告)号: | CN102799602B | 公开(公告)日: | 2018-03-16 |
发明(设计)人: | 王征;赵海军 | 申请(专利权)人: | 新奥特(北京)视频技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京挺立专利事务所(普通合伙)11265 | 代理人: | 叶树明 |
地址: | 100195 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 获取 数据 方法 系统 | ||
技术领域
本发明涉及互联网信息技术领域,特别涉及一种从互联网获取数据的方法和系统。
背景技术
由于信息技术的飞速发展,世界已经进入了信息的时代,信息是庞杂的,由于信息对于某些人群可资利用,因而被视为一种资源,这些可资利用的信息被称资讯。所谓资讯播出系统,也叫图文资讯播出系统,是相对于传统的电视播出系统而言的。传统的视频播出系统都是以播出活动电视画面和伴音为主要任务的,而资讯播出系统是以文字、图形、图表为主辅以动态影像,传播各类信息的系统。它可以独立完成一个电视频道(资讯频道、电视购物频道)的播出,也可以附加在传统播出系统中,增加频道的播出信息量。现有的资讯播出系统具有以下特性:1、图片、视频、上滚、左飞、动画角标同屏播出2、多行资讯信息实时修改实时播出3、度身定制各类电视栏目模板,栏目包装直接套用4、板式灵活多样,可任意设定多个广告位5、无限层字幕实时叠加6、广告窗中可添加大量图片广告信息以及动画文件,并且每条广告信息中可有标题和文字信息7、可以同时播出金融信息,汇率窗口,股市风云、天气预报等。资讯播出系统中播出的数据从网络数据提供商获得。
可扩展标记语言(Extensible Markup Language,XML),用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。XML是标准通用标记语言(SGML)的子集,非常适合Web传输。XML提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。
其中,RSS是XML文件的格式之一,RSS(简易信息聚合,也叫聚合内容)是一种描述和同步网站内容的格式。RSS可以是以下三个解释的其中一个:Really Simple Syndication;RDF(Resource Description Framework)Site Summary;Rich Site Summary。但其实这三个解释都是指同一种Syndication的技术。RSS目前广泛用于网上新闻频道,blog和wiki,主要的版本有0.91,1.0,2.0。使用RSS订阅能更快地获取信息,网站提供RSS输出,有利于让用户获取网站内容的最新更新。
从在发明人实现本发明的过程中,发现现有技术中存在以下缺陷:从互联网上获取XML文件时,只能对单一格式的数据进行订阅获取,不能同时对多种格式的数据进行识别。
发明内容
针对现有技术中的缺陷,本发明能够从互联网上智能识别不同格式包括RSS与非标准的RSS的XML文件,提高了从互联网上获取数据的灵活性,为用户提供更多的方便的和实时的网络资源。
为了解决以上技术问题本发明提供了一种从互联网获取数据的方法,具体包括:
从网络数据提供商获取可扩展标记语言XML文件;
判断获取到的所述XML文件是否合法,若合法,则分析所述XML文件,若符合聚合内容RSS的标准格式,则所述XML文件为RSS格式,否则为非标准的RSS格式;否则,重新从网络数据提供商获取所述XML文件;
将所述XML文件按照不同格式适应性存入目标数据库,具体包括:
当所述XML文件的格式为RSS时,解析后存入所述目标数据库中;或,当所述XML文件的格式为非标准的RSS时,直接存入所述目标数据库中。
其中,所述从网络数据提供商获取可扩展标记语言XML文件,具体包括:
根据用户需求以参数形式导入所述XML地址;
分析所述XML地址获取与之相对应的URL链接;
通过读取所述URL链接得到所述XML文件。
其中,判断获取到的所述XML文件是否合法,具体包括:
根据XML语法特性判断获取到的所述XML文件是否合法。
其中,所述当所述XML文件的格式为RSS时,解析后存入所述目标数据库中,具体包括:
当所述XML文件的格式为RSS时,解析后以行列方式存入所述目标数据库T_XmlRss表中。
其中,所述当所述XML文件的格式为非标准的RSS时,直接存入所述目标数据库中,具体包括:
当所述XML文件的格式为非标准的RSS时,直接将所述XML存入所述目标数据库T_XmlOriginal表中。
本发明还提供了一种从互联网获取数据的系统,具体包括:
获取单元,用于从网络数据提供商获取可扩展标记语言XML文件;
判断单元,用于判断获取到的所述XML文件是否合法;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新奥特(北京)视频技术有限公司,未经新奥特(北京)视频技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210126411.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:同步运行喷射式瓶腔干燥装置及方法
- 下一篇:一种废弃型壳再生利用方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置