[发明专利]一种数据处理方法和装置有效
申请号: | 201610046435.9 | 申请日: | 2016-01-25 |
公开(公告)号: | CN105740338B | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | 潘宇龙 | 申请(专利权)人: | 江苏国泰新点软件有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝;何立春 |
地址: | 215600 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
本发明公开了一种数据处理方法和装置。其中所述方法包括:对网页页面进行分析,确定网页页面中的文档页面模型DOM元素;根据DOM元素取得网页页面中的各控件的对应值;根据网页页面中的各控件的标识或名称,将各控件的对应值存入指定格式的文件中与各控件的标识或名称对应的项下。该技术方案不仅可以有效获取页面信息,还能将得到的数据写入指定格式的文件以便进一步在异构系统中进行数据交换,不再需要人工完成数据录入,不仅大大提高了效率,准确率也可以基本达到100%。
技术领域
本发明涉及计算机技术领域,特别涉及一种数据处理方法和装置。
背景技术
异构数据库系统是相关的多个数据库系统的集合,可以实现数据的共享和透明访问,每个数据库系统在加入异构数据库系统之前本身就已经存在。异构数据库的各个组成部分具有自身的自治性,实现数据共享的同时,每个数据库系统仍保有自己的应用特性、完整性控制和安全性控制。
但这也就造成了一个问题:由于各个一个数据库系统中数据存储格式不相同,异构数据库系统在不同网络之间进行数据交换非常繁琐,传统办法是通过人工进行手动输入,面对大量的数据录入和大量的业务办理,这种重复操作加重办理人员的工作量,带来疲劳,这种方法准确率,效率都不高。因此需要对数据进行适当的处理以便进行数据交换。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据处理方法和装置。
依据本发明的一个方面,提供了一种数据处理方法,包括:
对网页页面进行分析,确定网页页面中的文档页面模型DOM元素;
根据DOM元素取得网页页面中的各控件的对应值;
根据网页页面中的各控件的标识或名称,将各控件的对应值存入指定格式的文件中与各控件的标识或名称对应的项下。
可选地,所述对网页页面进行分析,确定网页页面中的文档页面模型DOM元素包括:
确定一个或多个正在运行的IE内核浏览器的辅助进程;
根据每个辅助进程确定该辅助进程对应的网页页面中的DOM元素。
可选地,所述根据DOM元素取得网页页面中的各控件的对应值包括:
对于text控件、textarea控件、checkbox控件、radio控件和select控件中的一种或多种,通过第一数据字典取得这些控件的对应值;
对于table控件,根据该控件中对应值所处列的列名及对应值在控件中的行号,通过第二数据字典取得该控件的对应值;
对于不存在标识或名称的自定义控件,根据页面结构为该自定义控件进行自动编码,通过第三数据字典取得该自定义控件的对应值。
可选地,该方法进一步包括:
如果一个网页页面中确定的DOM元素中包含IFRAME标签,则根据IFRAME标签进一步确定该网页页面的URL下的所有子URL,对每个子URL对应的网页页面都进行如上述的数据处理。
可选地,该方法进一步包括:将网页页面中的各控件进行分类;
所述根据网页页面中的各控件的标识或名称,将各控件的对应值存入指定格式的文件中与各控件的标识或名称对应的项下包括:对于网页页面中的每一类控件,根据该类中的各控件的标识或名称,将该类的各控件的对应值存入该类的指定格式的文件中对应的项下。
依据本发明的另一方面,提供了一种数据处理装置,包括:
网页页面分析单元,适于对网页页面进行分析,确定网页页面中的文档页面模型DOM元素;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏国泰新点软件有限公司,未经江苏国泰新点软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610046435.9/2.html,转载请声明来源钻瓜专利网。